Tendências de inovações para a tecnologia de big data
-
date post
19-Oct-2014 -
Category
Documents
-
view
489 -
download
0
description
Transcript of Tendências de inovações para a tecnologia de big data
Tendências de Inovações para a Tecnologia de Big Data
Outubro/2013
Relatório preparado pela Cysneiros Consultores Associados para a Secretaria de Ciência e Tecnologia do Estado de Pernambuco.
Pesquisadores ResponsáveisTecnologias da Informação e Comunicação: José Carlos Cavalcanti
Sumário
1 Introdução........................................................................................................................4
2 Análise das Tendências de Mercado em Tecnologia da Informação e Comunicação (TIC)5
2.1 Análise da Tecnologia de Big Data.......................................................................................7
2.2 Macrotendências de Inovação Tecnológica em Big Data..................................................14
2.3 Recomendações às Empresas de Tecnologia da Informação e Comunicação (TIC)......16
3 Conclusão.......................................................................................................................21
4 Referências.....................................................................................................................22
5 Glossário e Acrônimos...................................................................................................23
Índice de TabelasTabela 1. Aplicações de BI&A: De Big Data para Grande Impacto.....................................................................18
Índice de Figuras
Figura 1. Dados de busca sobre a expressão Big Data no Google Trends (do dia 14/03/2013)............................8
Figura 2. Vendas mensais da Ford Figura 3. Google Trends da Ford..........................................10
Figura 4. IDC prevê que Big Data valerá US$ 23,8 bilhões em 2016..................................................................12
Figura 5. Big Data: A Revolução Gerencial..........................................................................................................13
Figura 6. Visão Geral de BI&A: Evolução, Aplicações e Pesquisa Emergente....................................................15
Figura 7. Capa da revista VEJA de 15/05/2013....................................................................................................20
1 Introdução
Este relatório foi produzido no âmbito no projeto CICTEC - Centro de Inteligência
Competitiva para Parques Tecnológicos, e apresenta as principais tendências de inovação
tecnológica para o setor de Tecnologia da Informação e Comunicação (TICs) apontando
oportunidades de inovação para as empresas Pernambucanas.
O documento trata especificamente as oportunidades de inovação, no que se refere ao
fenôneno chamado de Big data, a qual se apresenta como uma das mais importantes
tecnologias de informação e comunicação recentes do mundo contemporâneo, e que
gradualmente vem assumindo um papel de relevância central. Big Data está revolucionando a
forma como conduzimos nossas vidas, como trabalhamos, como aprendemos, e com nos
entretemos, sendo de vital importância para os negócios do setor.
2 Análise das Tendências de Mercado em Tecnologia da Informação e Comunicação
(TIC)
Big Data (termo que se aplica à informação que não pode ser processada ou analisada
usando processos ou ferramentas tradicionais) é uma das mais importantes tecnologias de
informação e comunicação - TICs recentes do mundo contemporâneo, e está assumindo este
papel de relevância em função de uma série de princípios. Tomando como referência o que é
apontado no livro de Zikopoulos et. al. (2012), Big Data é importante devido a alguns
princípios chave:
- Soluções de Big Data são ideais para analisar não somente dados brutos
estruturados, mas também data semiestruturados e dados não estruturados a partir de uma
ampla variedade de fontes;
- Soluções de Big Data são ideais para análises interativas e exploratórias quando
medidas de negócios com dados não são pré-determinadas;
- Big Data é uma tecnologia adequada para resolver desafios de informação que não
podem ser tratados pelos enfoques tradicionais de bancos de dados relacionais usuais no
mercado.
Um das melhores maneiras de entender o desafio que vem sendo colocado por esta
tendência é o tratamento de alguns problemas usuais no mundo das TICs. Tomando como
referência o exemplo de Detecção de Fraudes (muito comum nas transações econômicas,
marcadamente as financeiras, tais como leilões on-line, solicitação de seguros, etc.). Em
qualquer lugar do mundo a existência de uma transação financeira representa um potencial
para mau uso e para o espectro da fraude.
Os vários desafios nos padrões de detecção de fraude são diretamente atribuídos ao
uso exclusivo de tecnologias convencionais. O tema mais comum e mais recorrente que se
percebe em todos os padrões de Big Data é o limite no que se pode armazenar bem como a
disponibilidade de recursos computacionais para processar seus objetivos. Sem tecnologias
de Big Data, estes fatores limitam o que pode ser modelado. Menos dados significam
modelagem restringida. Ademais, os ambientes altamente dinâmicos têm padrões cíclicos de
fraudes que podem vir e ir em horas, dias ou semanas. Se os dados usados para identificar ou
usar novos modelos de detecção de fraudes não estiverem disponíveis com baixa latência,
quando forem descobertos os novos padrões pode ser muito tarde e algum prejuízo pode já ter
sido instaurado.
Mas talvez o padrão de uso de Big Data mais comentado seja o das redes sociais (tais
como Facebook, Twiiter, YouTube, etc.), ou da mídia social e do sentimento do consumidor.
Neste caso, Big Data é usado para detectar o que os consumidores estão dizendo sobre você
(e talvez o que eles estão dizendo sobre os seus competidores). Além disso, você pode usar
este novo discernimento para verificar como este sentimento impacta as decisões que você
está tomando e o modo como sua empresa se engaja. Mais especificamente, você pode
determinar como o sentimento dos consumidores está impactando nas vendas, a efetividade
ou receptividade de suas campanhas de mercado, a eficácia de seu mix de marketing
(produto, preço, promoção, etc.) e por aí vai.
Em resumo, Big Data está revolucionando a forma como conduzimos nossas vidas,
como trabalhamos, como aprendemos, e como entretemos. Neste sentido, entender os
principais aspectos das tendências recentes da inovação tecnológica em termos de Big Data é
de vital importância, e constitui o principal objetivo deste documento.
2.1 Análise da Tecnologia de Big Data
Big Data não implica dizer que os dados pré-existentes são “pequenos” (o que não
são) ou que seu único desafio é o seu tamanho (tamanho é apenas um deles). O termo Big
Data se aplica à informação que não pode ser processada ou analisada usando processos ou
ferramentas tradicionais (Zikopoulos et. al. 2012). De forma crescente, as organizações de
hoje estão enfrentando mais e mais desafios de Big Data (ver sobre o explosivo crescimento
do universo digital em: http://bit.ly/13QKLgj. Elas têm acesso a uma riqueza de
informações, mas elas não sabem com extrair valor desta riqueza porque elas (as
informações) estão em sua maioria em formato bruto, ou em formato semi desestruturado ou
desestruturado; e como resultado, as organizações nem mesmo sabem se vale a pena mantê-
las.
Uma pesquisa recente da IBM observou que mais da metade dos atuais líderes de
negócios chegaram à conclusão que eles não têm acesso aos insights (discernimentos) que
eles precisam para conduzir seus trabalhos. Empresas estão enfrentando estes desafios em
um ambiente onde elas têm a habilidade para armazenar qualquer coisa e elas estão gerando
dados como nunca na história; de forma combinada, isto representa um desafio real de
informação. Ou seja, a capacidade de processar os dados (extraindo valor) é cada vez mais
um desafio a ser enfrentado.
Três características definem Big Data: volume, variedade, e velocidade (os
conhecidos 3 V´s). Juntas, estas características definem o que a IBM se refere à Big Data. Os
Professores Hans Buhl e Maximillian Roglinger, da Universidade de Augsburg, na
Alemanha, e Julia Heidemann, da empresa McKinsey da Alemanha, acrescentam outra
caraterística (outro V): a da veracidade.
O fenômeno do Big Data é impulsionado pela massiva redução em custo na gestão de
dados, combinada com o aumento exponencial da capacidade de processamento
computacional que vemos nos dias atuais. Novas tecnologias, tais como Quantum
Computing, ou sistemas In Memory Database permitem a manipulação de novas dimensões
de quantidades de dados rapidamente e de forma economicamente eficiente (volume e
velocidade).
Enfoques de Big Data requerem novas ferramentas tais como Analíticas Social, In-
Memory, Texto, ou Semântica, que permitem analisar novas quantidades de diferentes fontes
de informação, por exemplo, de redes sociais, engenhos de busca, transações de pagamentos,
ou todas as categorias de e-Commerce (variedade).
O sucesso de Big Data é inevitavelmente relacionado com uma gestão inteligente de
seleção e uso de dados, bem como esforços conjuntos em direção a regras claras com respeito
à qualidade dos dados. Uma clara governança de dados e uma clara política de dados são
inevitáveis para capacitar um uso de significado dos dados (veracidade).
Para que se perceba a importância de Big Data como uma tecnologia emergente, basta
que se observe os dados coletados pela ferramenta (de Big Data) chamada Google Trends
(Figura 01 à frente). Google Trends é uma poderosa ferramenta que emergiu a partir da
existência do Google, e pode ser apresentada a partir de um importante artigo recente do Prof.
Hal Varian (tratado logo à frente), o qual revela sua contribuição para esta nova era de Big
Data e Analítica.
Figura 1. Dados de busca sobre a expressão Big Data no Google Trends (do dia 14/03/2013)
Pode parecer uma coisa “maluca” (principalmente para os economistas mais
conservadores ou que ainda estão na era pré-Internet), mas a ferramenta denominada Google
Trends, ferramenta simples e gratuita baseada nos dados de buscas do Google, pode sim
ajudar a prever o nível presente de atividade econômica, e há pelo menos três anos está
revolucionando as análises econômicas neste novo mundo do BIG DATA e da Analytics.
Quem afirma isso é nada mais nada menos do que o Prof. Hal Varian, economista
internacionalmente conhecido por seus trabalhos em microeconomia, hoje aposentado pela
Universidade da California, em Berkeley/EUA, e atualmente o Chief Economist Officer do
Google. No ano de 2002 o Prof. Varian foi convidado por Eric Schmidt (ex- Chief Executive
Officer) para ser consultor do Google. Desde então ele tem desenvolvido atividades nas
áreas de projeto de leilões eletrônicos de propaganda, econometria, finanças, estratégia
corporativa e política pública.
Em abril 2009, em coautoria com Hyunyoung Choi, também do Google, ele escreveu
(e publicou no site do Google) uma “versão beta” do artigo intitulado “Predicting the Present
with Google Trends” (Prevendo o Presente com Google Trends)(artigo finalmente publicado
por uma revista econômica tradicional, em 2012). Neste artigo os autores avançam a hipótese
de que os dados de busca do Google podem estar correlacionados com o presente nível da
atividade econômica em indústrias dadas e, por conseguinte, podem ser úteis em prever as
subsequentes liberações de dados. Eles defendem que o Google Trends não ajuda a prever o
futuro, mas sim ajuda a prever o presente.
Como mostram os autores, o Google Trends provê um índice do volume das
buscas/perguntas do Google por localização geográfica e categoria. Os dados da ferramenta
não reportam o nível bruto das perguntas para um dado termo de busca. Na realidade eles
reportam um “índice de pergunta” (query index). O índice de pergunta começa com a
“porção de perguntas”: o volume total de perguntas por termo de busca em uma dada região
geográfica, dividido pelo número total de perguntas naquela região em um ponto no tempo.
Os números da participação das perguntas são então normalizados de forma que eles
comecem a partir de 01 de janeiro de 2004. Números após esta data indicam um desvio
percentual da porção de busca no dia 01 de janeiro de 2004.
No artigo em questão, os autores discutem a estrutura estatística relevante à hipótese
que levantam. E como exemplo, eles iniciam a análise se baseando nos dados de vendas
mensais de automóveis da marca Ford de janeiro de 2004 a agosto de 2008, como reportado
na revista Automobile News. Os dados do Google para a categoria Automobile/Vehicle
Brands/Ford foram usados para o índice de perguntas.
Para que pudessem estabelecer a correlação entre os dados de busca do Google e os
dados de vendas de automóveis da marca Ford (o que pode ser, de alguma forma, visualizado
pelos gráficos dos dados trabalhados, nas Figuras 02 e 03 à frente), os autores desenvolveram
um modelo de projeção, conhecido na área de econometria como modelo “auto regressivo
sazonal”. Em resumo, com o modelo encontrado os autores chegaram à seguinte conclusão: o
coeficiente da variável Google Trends no modelo implica que 1% de aumento no volume de
buscas está associado à aproximadamente 0,5% de aumento de vendas. Os autores ainda
apresentam outros exemplos de correlações em outros setores econômicos, tais como vendas
no varejo, vendas de imóveis e dados de viagens.
Finalmente, o que pretendemos afirmar com esta breve apresentação da utilização do
Google Trends é que, nos dias atuais, com o crescimento no volume, na velocidade e na
variedade de dados à nossa disposição, temos que nos valer deste crescente “dilúvio de
dados/informações” (e das novas ferramentas que estão emergindo concomitantemente, tais
como Google Consumer Surveys, que falaremos em outra oportunidade) para extrairmos
novos insights (discernimentos) a partir destes dados/informações.
Figura 2. Vendas mensais da Ford Figura 3. Google Trends da Ford
E qual é a importância econômica do Big Data como tendência tecnológica? Segundo
estimativas de janeiro de 2013 da empresa IDC- International Data Corporation, Big Data
representará em 2016 um mercado da ordem de US$ 24 bilhões, o que não é desprezível para
um mercado ainda na sua infância (Figura 04).
Como saber se Big Data é uma tendência que pode ser considerada hype ou não? Ano
passado (2012) o Editor da Harvard Business Review (http://hbr.org/)(das mais prestigiosas
revistas de negócios do mundo), Adi Ignatius, percebeu que estava havendo um grande
interesse por big data, mas também um grande hiato de clareza sobre o tema. Logo,
perguntou-se: o que diferencia “big” data de mero “data” – e como as organizações
supostamente os estão usando em seus benefícios? Ele também aprendeu que muitos dos
céticos ponderavam se algumas das companhias vendendo “soluções” de big data estão
simplesmente capitalizando no emergente hype.
Figura 4. IDC prevê que Big Data valerá US$ 23,8 bilhões em 2016
Neste sentido, Ignatius agrupou algumas das melhores mentes do campo para iluminar
o tópico (ver edição especial de outubro de 2012 em
http://hbr.org/special-collections/insight/big-data). Andrew MacAfee e Erik Brynjolfsson,
ambos do MIT, apresentaram o argumento de que big data tem o potencial de revolucionar a
arte de administrar (gerir). Domini Barton e David Court, da McKinsey, concordam. Eles
demonstram que com o correto suporte organizacional, big data pode ajudar a propalar as
companhias a níveis de desempenho que não tínhamos visto há duas décadas. Tom
Davenport, Professor Visitante da Harvard Business School, e D. J. Patil, da Greylock
Parterns, identificam cientistas de dados como tendo o “mais sexy” trabalho de nossa era e
explicam como achá-los e atraí-los.
Destacamos aqui apenas partes do trabalho de Andrew MacAfee e Erik Brynjolfsson
(Figura 05 à frente), que se intitula “Big Data: The Management Revolution”. Os autores logo
de partida argumentam que à medida que ferramentas e filosofias de big data se espalham,
elas irão mudar as ideias arraigadas sobre valor da experiência, a natureza da expertise, e a
prática da administração (gestão). Líderes inteligentes ao longo das indústrias irão ver que
usar big data pelo que ele é: uma revolução administrativa (gerencial).
Apesar de constituir um amplo conjunto de oportunidades, a tendência de Big Data
traz consigo um conjunto preocupante de aspectos para um país como o Brasil. Como o país
enfrenta uma série de dificuldades na “saúde de sua indústria de TICs” (como demonstrado
pela sua posição no Global Network Readiness Index- NRI), e como as tecnologias de Big
Data demandam uma série de competências e habilidades para sua absorção, capacitação e
oferta de bens e serviços, faz-se necessário estabelecer dentro do país forças tarefas, tanto na
iniciativa privada quanto nas esferas do setor público, para proporcionar o desenvolvimento
das competências e habilidades compatíveis com a complexidade do Big Data.
Figura 5. Big Data: A Revolução Gerencial
2.2 Macrotendências de Inovação Tecnológica em Big Data
Já que Big Data é uma tendência tecnológica que veio para ficar, quais seriam então
aquelas macrotendências (em termos de novos desenvolvimentos e aplicações) que estão
conformando, e estão sendo conformadas, pelo avanço do Big Data?
Como pode ser visto na Figura 06 à frente, retirada de um artigo de Chen et. al.
(2012), e que diz respeito à evolução de Inteligência de Negócios (Business Intelligence- BI)
e Analítica (BI&A na tabela), uma grande tendência trazida pelo Big Data é a evolução da
atual fase de uso dos chamados Database Management Systems – DBMS (Sistemas de
Gerenciamento de Bancos de Dados), que lidam com conteúdos de dados estruturados (a
etapa BI&A 1.0), para a fase BI&A 2.0, onde estão sendo (e serão ainda mais) tratados
conteúdos de dados não estruturados (marcadamente baseados na Web).
A fase seguinte na evolução proporcionada por Big Data será a de conteúdos baseados
em artefatos móveis e em sensores (a etapa BI&A 3.0). Estas evoluções estão impactando (e
impactarão ainda mais) nas aplicações de comércio eletrônico e inteligência de mercado,
governo eletrônico, em política, ciência e tecnologia, saúde e bem-estar, segurança e proteção
pública. Estes impactos estão fazendo emergir (e irão fazer ainda mais no futuro) novas áreas
de pesquisa, tais como Analítica de Big Data, Analítica de Textos, Analítica da Web,
Analítica de Redes e Analítica de Dispositivos Móveis.
Figura 6. Visão Geral de BI&A: Evolução, Aplicações e Pesquisa Emergente.
Fonte: Chen, Hsinchun, Chiang, Roger H. L., and Storey, Veda C. (2012). “Business Intelligence and
Analytics: From Big Data to Big Impact”. MIS Quarterly, Vol. 36, No. 4, 1165-1188, December.
2.3 Recomendações às Empresas de Tecnologia da Informação e Comunicação (TIC)
As macrotendências abordadas no item anterior são indicativas da geração de um
enorme leque de oportunidades que estão sendo (e serão ainda mais) abertas pelo crescimento
da área de Big Data. Como é possível contatar na Tabela 01 à frente, retirada de Chen et. al.
(2012), e tomando como exemplo o segmento econômico de comércio eletrônico e
inteligência de mercado, as aplicações que estão surgindo são de variada natureza.
Neste sentido, podemos destacar como novas aplicações os sistemas de
recomendação, monitoramento e análise de mídia social, sistemas de crowdsourcing (onde
crowd, vem de multidão, e sourcing, de práticas de contratação, tais como as de procurement,
ou seja, compras, licitações, etc., e que se refere à capitalização do potencial de grandes e
abertos grupos de pessoas via Internet), jogos sociais e virtuais.
Em termos de dados propriamente ditos, temos os logs de busca e de usuário, registros
de transações de consumidores, cujas características podem ser dados estruturados baseados
na web, conteúdo gerado por usuários, rede rica em informação, e opiniões informais
desestruturadas. Em relação à analítica, podemos ter ferramentas de mineração por regras de
associação, segmentação de bancos de dados e clusterização, detecção de anomalias,
mineração de gráficos, análise de redes sociais, analítica de texto e da web, e análise de
sentimento e de afetação.
Elencar oportunidades neste universo parece ser algo simples, já que o conjunto de
evidências que estão surgindo sobre as “maravilhas” de Big Data não para de surgir. No
entanto, nem só de oportunidades vivem os mercados, e ameaças surgem a qualquer
momento. Duas que são frequentemente citadas são aquelas que dizem respeito à Segurança
dos Dados e de Informações e Privacidade. No entanto, ainda é muito cedo para se tratar
destas ameaças no âmbito de tecnologias tão sofisticadas como as que estão sendo aqui
discutidas. De qualquer forma estas ameaças serão tratadas em maior detalhe no documento
sobre cloud computing, já que este é o espaço onde estão se estruturando as maiores
iniciativas de Big Data.
Em resumo, estendendo a observação pontual acima conduzida para as outras áreas da
Tabela 3, pode-se inferir que o universo de oportunidades que estão se abrindo com Big Data,
tanto em escala quanto em escopo, está apontando para um novo horizonte que pode
contribuir enormemente para o crescimento das empresas brasileiras em geral, e das empresas
pernambucanas em particular.
A emergência da tecnologia de Big Data é uma chance para todos do mundo da
tecnologia decidirem em que campo eles estarão, à medida que esta área está trazendo (e trará
ainda mais no futuro) a maior oportunidade para empresas e indivíduos em tecnologia desde
o alvorecer da Internet.
Tabela 1. Aplicações de BI&A: De Big Data para Grande Impacto
Comércio Eletrônico e Inteligência de Mercado
Governo Eletrônico e Política 2.0
Ciência e Tecnologia Saúde Inteligente e Bem Estar
Segurança e Defesa Pública
Aplicações • Sistemas de Recomendação
• Monitoramento e Analítica de Mídia Social
• Sistemas de Crowd-sourcing
•Jogos sociais e virtuais
•Serviços de governo ubíquos
•Acesso igualitário e serviços públicos
•Engajamento de cidadãos e participação
•Campanha política e eleição eletrônica
•Inovação em Ciência e Tecnologia
•Teste de hipóteses
•Descoberta de conhecimento
•Genômica humana e de plantas
•Suporte à decisão em cuidados da saúde
•Análise de comunidades de pacientes
•Análise de crime; •Criminologia computacional; •Informática de terrorismo; •Inteligência de código aberto; •Segurança cibernética
Dados •Logs de busca e de usuários
•Registros de transações de consumidores
•Conteúdo gerado por consumidores
•Informações e serviços do governo
•Regras e regulações
•Feedback do cidadão e comentários
•Instrumentos de Ciência e Tecnologia e dados gerados por sistemas
•Conteúdo de sensores e redes
•Dados de genômica e de sequenciamentos
•Registros eletrônicos de saúde
•Mídia social de saúde e de pacientes
•Registros criminais; •Mapas criminais; •Redes criminais; •Notícias e conteúdos web; •Bancos de dados de incidentes terroristas; • Vírus, ataques cibernéticos e botnets
Características
Conteúdo estruturado gerado pelo consumidor, baseado na web, rica informação de rede, opiniões informais não estruturadas
Características
Fontes de informação fragmentadas e sistemas legados, rico conteúdo textual, conversações informais desestruturadas de cidadãos
Características
Coleta de dados baseados em instrumentos de alto throughput, registros de múltipla modalidade e larga escala, formatos de dados específicos de Ciência e Tecnologia
Características
Conteúdos disparatados mas altamente relacionados, conteúdo específico personalizado, HIPAA, IRB e questões de ética
Características
Informação de identificação pessoal, conteúdo incompleto e desviante, informação de grupo e de redes, conteúdo de múltiplas línguas
Analítica •Regra de mineração por associação
•Segmentação de banco e dados e clustering
•Detecção de anomalias
•Mineração gráfica
•Analítica de texto e web
•Análise de sentimento e afetação
•Integração de informação
•Analítica de conteúdo e de texto
•Serviços de informação semântica de governo
•Monitoramento e analítica de mídia social
•Análise de sentimento e afetação
•Modelos matemáticos e analíticos baseados em domínios específicos de Ciência e Tecnologia
•Análise e visualização de genômica e sequenciamento; •Mineração e clusterização de associação de EHR; •Monitoramento e análise de mídia de saúde social; •Analítica de texto de saúde;
•Ontologias de saúde
•Análise de rede de pacientes
•Regra de associação criminal em mineração e clusterização; •Análise de rede criminal; •Análise espacial-temporal e visualização; •Analítica de textos multilinguais;
•Análise de sentimento e afetação
•Análise e distribuição de ataques cibernéticos
Impactos Marketing da cauda-longa e recomendações personalizadas, venda aumentada e satisfação do consumidor
Transformando governos, empoderando cidadãos, melhorando transparência, participação e igualdade
•Avanços de Ciência e Tecnologia, impacto científico
•Qualidade melhorada dos cuidados da saúde, cuidado de longo prazo melhorado, empoderamento do paciente
Melhoria na segurança e defesa públicas
Segundo Zikopoulos et. al. (2012), desde a virada deste milênio:
- 80% (oitenta por cento) da informação do mundo é desestruturada;
- A informação desestruturada cresce 15 (quinze) vezes mais do que a taxa da
informação estruturada;
- O poder computacional bruto está crescendo a uma taxa tão grande hoje uma caixa
tirada de uma prateleira hoje está começando a mostrar um poder que um supercomputador
mostrava uma década atrás;
- O acesso à informação tem se democratizado: ele é (e deve ser) disponível a todos.
Este é o novo “normal” do nosso cotidiano e para o qual Big Data se apresenta como
uma gigantesca resposta a estes desafios. E pensando no futuro, e na evolução das TICs no
Brasil como um todo, e em Pernambuco em particular, este documento procurou focar sua
atenção para Big Data. E como foi possível registrar, Big Data, em seus complexos aspectos
de volume, variedade, velocidade e veracidade, constitui uma grande oportunidade
tecnológica e econômica, bem como uma revolução gerencial, que está trazendo um
amplíssimo conjunto de novas fronteiras para o desenvolvimento de novos produtos e
serviços, que podem contribuir enormemente para o presente e para o futuro das nossas
empresas brasileiras e pernambucanas em primeiro lugar, e, no limite, para o bem estar de
suas populações.
A título de exemplo de como Big Data está se tornando popular, basta que se
mencione recente matéria da revista VEJA, de 15/05/2013 (Figura 07 a seguir), onde o tema
de Big Data além ter sido capa desta popular revista, ocupou 11 (onze) páginas da edição e
foi alçado à importância da emergência da Internet. Nesta matéria, entre vários exemplos que
foram citados do uso de Big Data, um chama especial atenção. Segundo a revista, Big Data
oferece significado, correlação, mas não oferece a causa dos eventos. E cita uma pesquisa da
Universidade de Cambridge (Inglaterra), com base em dados de 58.000 usuários do
Facebook, descobriu uma relação inusitada: pessoas com alto QI (Quociente de Inteligência)
têm apreço especial pela voz do ator norte-americano Morgan Freeman. Por quê? Ninguém
sabe!
De toda forma, este exemplo é apenas um daqueles interessantes que o fenômeno do
Big Data proporciona aos seus usuários. Como enfatizado aqui neste documento, cabe às
empresas encontrarem nos seus dados (ou nos dados dos seus clientes) as associações e
correlações que possibilitem a obtenção de mais vantagens aos seus negócios.
Figura 7. Capa da revista VEJA de 15/05/2013
3 Conclusão
Neste documento, foram apresentadas tendências de inovação tecnológica nos setores
de Tecnologia da Informação e Comunicação (TICs) apontando oportunidades de inovação
para as empresas Pernambucanas.
Apresentamos as tecnologias de Big Data e as novas possibilidades de produção de
inteligências a partir da análise de dados semiestruturados. Assim, percebemos que o
fenômeno do Big Data é impulsionado pela massiva redução em custo na gestão de dados,
combinada com o aumento exponencial da capacidade de processamento computacional que
vemos nos dias atuais. Enfoques de Big Data também requerem novas ferramentas tais como
Analíticas Social, ou Semântica, que permitem analisar novas quantidades de diferentes
fontes de informação, por exemplo, de redes sociais, engenhos de busca, transações de
pagamentos, ou todas as categorias de e-Commerce.
Por fim, o sucesso de Big Data é inevitavelmente relacionado com uma gestão
inteligente de seleção e uso de dados, bem como esforços conjuntos em direção a regras
claras com respeito à qualidade desses dados. Uma clara política e clara governança de dados
são inevitáveis para capacitar um uso de significado dos dados, com o exponencial
crescimento na geração de dados pelos mais diversos dispositivos, abre-se um amplo leque de
oportunidades de produção de inteligências competitiva.
4 Referências
Chen, Hsinchun, Roger H. L. Chiang, Veda C. Storey (2012). “Business Intelligence
and Analytics: From Big Data to Big Impact”. MIS Quarterly, Vol. 36, No. 4, 1165-1188,
December.
Hyunyoung Choi and Hal Varian (2012). “Predicting the Present with Google
Trends”. The Economic Record, Vol. 88, Special Issue, June, 2-9.
Zikopoulos, Paul C, Cris Eaton, Dirk deRoos, Thomas Deutsch, George Lapis (2012).
“Understanding Big Data; Analytics for Enterprise Class Hadoop and Streaming Data”.
McGrawHill.
5 Glossário e Acrônimos
Analytics – ferramentas, técnicas e modelos para analisar Big Data
Big Data – informação que não pode ser processada ou analisada por processos ou
ferramentas tradicionais
NRI- networked readiness index (índice de preparo em rede)
TI- tecnologias de informação
TICs - tecnologias de informação e comunicação