De acordo com Lock, Lock e Lock (2017), estima-se que a quantidade de dados novos é dobrada a cada dois anos, ou seja, mais do que a soma de dados gerados ao longo dos últimos cinco mil anos. Um dos principais motivos é a disponibilidade desses dados compartilhados na internet, mas, sobretudo, da conexão de dispositivos físicos – chamados de Internet das Coisas (ou Internet of things em inglês) com as redes virtuais.
Os dados em si são chamados de precedentes a informação, ou seja, referem-se a uma coleção de observações, sejam por meio de medidas, gêneros, respostas de pesquisa etc. (TRIOLA, 2014). Os dados apresentam-se de forma bruta, sem qualquer significado aparente (LOCK; LOCK; LOCK, 2017). Para gerar alguma informação, os dados precisam ser coletados, organizados, tratados e analisados. Obviamente, os tipos de análise dependem do tipo de informação que se deseja gerar, entretanto, o processo de coleta, organização e tratamento ocorre de forma similar. Apenas com relação à origem dos dados, estes podem ser classificados em dados estruturados e não estruturados.
Sobre dados não estruturados, assinale a alternativa incorreta:
A ) Os dados não estruturados referem-se a dados obtidos sem
uma formatação pré-definida.
B ) Os dados não estruturados podem ser coletados de diversas fontes, como redes sociais e outras páginas da web ao qual podem ser transformados em informações.
C ) Os dados são organizados de forma padronizada.
D ) Os dados não estruturados requerem algumas etapas de
organização de dados após a sua coleta.