Mokslas

Kas yra didieji duomenys? »Jo apibrėžimas ir reikšmė

Anonim

Kiekvieną dieną didelės organizacijos atnaujina technologijas, kurios palengvina ir geriau tinka kiekvienai įmonei, susiduria su dideliais iššūkiais, leidžiančiais atrasti ir analizuoti ne tik kasdien naudojamus įrankius, bet būtent jas ir buvo sukurta. vadinamieji didieji duomenys arba didžiuliai ispanų duomenys, kurie yra didelio masto duomenų saugojimo sistemos.

Šis saugojimo reiškinys įtvirtintas naujosiose informacinėse ir ryšių technologijose. Didieji duomenys yra visa veikla, susijusi su sistemomis, kuriose saugomas didelis duomenų rinkinys. Viena pagrindinių savybių yra ta, kad ji manipuliuoja dideliu informacijos kiekiu, ją renka, klasifikuoja, o vėliau saugo. Šios kolekcijos tikslas yra sukurti statistines ataskaitas, skirtas organizacijoms naudoti, be kita ko, kaip verslo planų analizė, reklama, šnipinėjimas.

Laikymo riba per metus išaugo, nuo 2008 m. Duomenų lygis buvo matuojamas petabaitais - zetabaitais. Ekspertai periodiškai ieško naujų saugojimo priemonių, nes yra tam tikrų sričių, kuriose reikia saugoti didelius duomenų kiekius, o esamos programos nėra labai optimalios.

Yra tūkstančiai įrankių, skirtų „Big Data“ kurti ir valdyti, tačiau ne visi yra vienodi, yra trijų tipų duomenys:

  1. Struktūrizuoti duomenys: yra tie, kur duomenų struktūra yra labai ypatinga, pvz., Datos, skaičiai ir kt. Jų pavyzdys yra skaičiuoklės.
  2. Datos no estructurados: usualmente son datos que tienen un formato específico y no se pueden almacenar en hoja de cálculos y mucho menos manipular la información, un ejemplo de lo los documentos en PDF.
  3. Datos semiestructurados: este tipo de datos no tienen un formato en particular, ya que cuentan con sus propios metadatos semiestruturados, ejemplo de estos son los codigos HTML.