top of page
  • Foto do escritorTime GRUPO XPER GLOBAL

IA generativa como catalisador de tecnologia



Para entender o que está por vir, é necessário entender os avanços que permitiram o surgimento da IA generativa, que levou décadas em construção. ChatGPT, GitHub Copilot, Stable Diffusion, Gemini da Google e Watson X da IBM e outras ferramentas de IA generativas que capturaram a atenção do público atual, são o resultado de níveis significativos de investimento nos últimos anos que ajudaram a promover o aprendizado de máquina e o aprendizado profundo. Esse investimento sustenta os aplicativos de IA incorporados em muitos dos produtos e serviços que usamos todos os dias.

Mas como a IA permeou nossas vidas de forma incremental?

Por meio de tudo, desde a tecnologia alimentando nossos smartphones para recursos de direção autônoma em carros como as ferramentas que os varejistas usam para surpreender e encantar os consumidores - seu progresso foi quase imperceptível. Marcos claros, como quando o AlphaGo, um programa baseado em IA desenvolvido pela DeepMind subdisiária da Google Alphabet, derrotou o maior jogador do mundo e campeão do jogo "Go" em 2016, foram celebrados, mas rapidamente desapareceram da consciência publica.

O ChatGPT e seus concorrentes capturaram a imaginação de pessoas ao redor do mundo de uma forma que o AlphaGo não fez, graças à sua ampla utilidade - quase qualquer um pode usá-los para comunicar e criar - e óbvio, a capacidade sobrenatural de ter uma conversa com um usuário.

Os mais recentes aplicativos de IA generativa podem executar uma variedade de tarefas de rotina, como a reorganização e classificação de dados. Mas é sua capacidade de escrever texto, compor música, e criar arte digital que ganhou manchetes e persuadiu consumidores e famílias

para experimentar por conta própria. Como resultado, um conjunto mais amplo de partes interessadas está lidando com impacto da IA generativa nos negócios e na sociedade, mas sem muito contexto para ajudá-los a fazer sentido disso.


Como chegamos aqui? Gradualmente, então de repente.

Para os fins deste artigo, definimos IA generativa como aplicativos normalmente criados usando modelos de base. Esses modelos contêm extensas redes neurais artificiais inspiradas nos bilhões de neurônios conectados no cérebro humano. Os modelos de fundação fazem parte do que é chamado de aprendizado profundo, um termo que faz alusão às muitas camadas profundas dentro das redes neurais. O aprendizado profundo impulsionou muitos dos avanços recentes em IA, mas os modelos básicos que alimentam os aplicativos generativos de IA são uma evolução radical no aprendizado profundo. Ao contrário dos modelos anteriores de aprendizado profundo, eles podem processar conjuntos extremamente grandes e variados de dados não estruturados e semi estruturados, executando mais de uma tarefa.

Os modelos de fundação permitiram novos recursos e melhoraram amplamente os existentes em toda a uma ampla gama de modalidades, incluindo imagens, vídeo, áudio e código de computador. AI treinada nesses modelos pode executar várias funções; pode classificar, editar, resumir, responder perguntas e redigir novos conteúdos, entre outras tarefas.

A inovação contínua também trará novos desafios. Por exemplo, o poder computacional necessário para treinar IA generativa com centenas de bilhões de parâmetros ameaça se tornar um gargalo no desenvolvimento. Além disso, há um movimento significativo - liderado pela abertura de comunidades éticas e se espalhando para os próprios líderes das empresas de IA generativa - para tornar a IA mais responsável, o que poderia aumentar seus custos.

No entanto, o financiamento para IA generativa, embora ainda seja uma fração do total de investimentos em  inteligência artificial, é significativo e está crescendo rapidamente, alcançando um total de US$ 12 bilhões nos primeiros cinco meses de 2023 isoladamente, fechando o ano com US$ 17,4 bilhões. Capital de risco e outros investimentos externos privados aumentaram esse numero em 2024 para US$ 50 bilhões. 

A IA aumentou em uma taxa média de crescimento composto de 74% ao ano de 2017 a 2022.

Durante o mesmo período, os investimentos em inteligência artificial em geral aumentaram anualmente em 29 por cento, embora a partir de uma base mais elevada.

A pressa de investir dinheiro em todas as coisas de IA generativa reflete a rapidez com que suas capacidades estão sendo desenvolvidas. O ChatGPT foi lançado em novembro de 2022. Quatro meses depois, o OpenAI lançou um novo modelo de linguagem natural, ou LLM, chamado GPT-4 com recursos nitidamente aprimorados.

Da mesma forma, em maio de 2023, a IA generativa da Anthropic, foi capaz de processar 100.000 tokens de texto, igual a cerca de 75.000 palavras em um minuto - a duração média de um romance - em comparação com cerca de 9.000 tokens quando foi introduzido em março de 2023. 

Em 2023, o Google anunciou vários novos recursos alimentados por IA generativa, incluindo Experiência de pesquisa generativa e um novo LLM chamado PaLM 2, que potencializará seu chatbot Gemini, entre outros produtos do Google.

De uma perspectiva geográfica, o investimento privado externo em IA generativa, principalmente de gigantes da tecnologia e empresas de capital de risco, está amplamente concentrada na América do Norte, refletindo a atual domínio do continente no cenário geral de investimentos em IA, relacionados à IA generativa de empresas sediadas nos Estados Unidos que arrecadaram cerca de US$ 8 bilhões entre 2020 a 2022, contabilizando cerca de 75 por cento dos investimentos totais em tais empresas durante esse período.


A IA generativa surpreendeu e empolgou o mundo com seu potencial para remodelar a forma como o trabalho do conhecimento é feito em setores e funções de negócios em toda a economia. Em funções como vendas e marketing, operações com clientes e desenvolvimento de software, ela está preparada para transformar as funções e aumentar o desempenho. No processo, poderia desbloquear trilhões de dólares em valor em todos os setores, do bancário às ciências da vida. Usamos duas lentes sobrepostas neste relatório para entender o potencial da IA generativa para criar valor para as empresas e alterar a força de trabalho. As seções a seguir compartilham nossas descobertas iniciais.


Glossário
A interface de programação de aplicativos (API) é uma maneira de acessar de forma programática modelos (geralmente externos), conjuntos de dados ou outras peças de software.
A inteligência artificial (IA) é a capacidade do software de executar tarefas que tradicionalmente exigem inteligência humana.
Redes neurais artificiais (ANNs) são compostas por camadas interconectadas de software baseado em calculadoras conhecidas como “neurônios”. Essas redes podem absorver grandes quantidades de dados de entrada e processar esses dados por meio de várias camadas que extraem e aprendem os recursos dos dados.
O aprendizado profundo é um subconjunto do aprendizado de máquina que usa redes neurais profundas, que são camadas de “neurônios” conectados cujas conexões possuem parâmetros ou pesos que podem ser treinados. É especialmente eficaz para aprender com dados não estruturados e semi estruturados, como imagens, texto e áudio.
Cenários iniciais e finais são os cenários extremos de nosso modelo de automação de trabalho.  O cenário “mais antigo” flexiona todos os parâmetros até os extremos das suposições plausíveis, resultando em desenvolvimento e adoção de automação mais rápidos, e o cenário “mais recente” flexiona todos os parâmetros na direcção oposta. A realidade é provável que caia em algum lugar entre os dois.
O ajuste fino é o processo de adaptação de um modelo de fundação pré-treinado para um melhor desempenho em uma tarefa específica. Isso envolve um período relativamente curto de treinamento em um conjunto de dados rotulados, que é muito menor do que o conjunto de dados no qual o modelo foi inicialmente treinado. Este treinamento adicional permite que o modelo aprenda e se adapte às nuances, terminologia e padrões específicos encontrados no conjunto de dados menor.
Os modelos de fundação (FM) são modelos de aprendizado profundo treinados em grandes quantidades de dados semi estruturados, não estruturados e não rotulados que podem ser usados para uma ampla gama de tarefas prontas para uso ou adaptados a tarefas específicas por meio de ajustes finos. Exemplos desses modelos são GPT-4, PaLM, DALL·E 2 e Difusão Estável.
IA generativa é uma IA que normalmente é construída usando modelos básicos e possui recursos que AI que a anterior não tinha, como a capacidade de gerar conteúdo. Os modelos de fundação também podem ser usado para fins não generativos (por exemplo, classificar o sentimento do usuário como negativo ou positivo com base em transcrições de chamadas), oferecendo uma melhoria significativa em relação aos modelos anteriores.
Para simplificar, quando nos referimos à IA generativa neste artigo, incluímos todos os modelos de base e casos de uso.
Unidades de processamento gráfico (GPUs) são chips de computador que foram originalmente desenvolvidos para produzir gráficos de computador (como para videogames) e também são úteis para aprendizado profundo. Em contraste com o aprendizado de máquina tradicional que geralmente são executados em unidades centrais de processamento (CPUs), normalmente chamadas de "processador" de um computador.
Os modelos de linguagem grandes (LLMs) compõem uma classe de modelos de base que podem processar grandes quantidades de texto não estruturado e aprender as relações entre palavras ou partes de palavras, conhecidas como tokens. Isso permite que os LLMs gerem texto em linguagem natural, realizando tarefas como resumo ou extração de conhecimento. GPT-4 (subjacente ao ChatGPT) e LaMDA (o modelo por trás da Bard) são exemplos de LLMs.

Aprendizado de máquina (ML) é um subconjunto de IA no qual um modelo ganha recursos após ser treinado em, ou mostrado, com muitos pontos de dados de exemplo. Os algoritmos de aprendizado de máquina detectam padrões e aprendem como fazer previsões e recomendações processando dados e experiências, em vez de receber instruções de programação explícitas. Os algoritmos também se adaptam e podem se tornar mais eficazes em resposta a novos dados e experiências.
Modalidade é uma categoria de dados de alto nível, como números, texto, imagens, vídeo e áudio.

A produtividade do trabalho é a razão entre o PIB e o total de horas trabalhadas na economia. Trabalha o crescimento da produtividade que vem de aumentos na quantidade de capital disponível para cada trabalhador, a educação e experiência da força de trabalho e melhorias na tecnologia afetam a produtividade.

A engenharia de  prompts refere-se ao processo de projetar, refinar e otimizar a entrada de prompts para orientar um modelo de IA generativo para produzir saídas desejadas (isto é, precisas).

A auto-atenção, às vezes chamada de intra-atenção, é um mecanismo que visa imitar atenção, relacionando diferentes posições de uma única sequência para calcular uma representação da seqüência.

Dados estruturados são dados tabulares (por exemplo, organizados em tabelas, bancos de dados) que podem ser usadas para treinar alguns modelos de aprendizado de máquina de forma eficaz.

Dados semi estruturados são dados organizados dentro de um arquivo fechado, sendo necessário abrir o programa para leitura(planilhas, editor de texto, apresentações e etc).

Dados não estruturados são dados sem organização prévia podendo ser captados por sensores, como exemplo (voz, imagem, temperatura e etc).

Os transformadores são uma arquitetura de rede neural relativamente nova que depende da auto-atenção de mecanismos para transformar uma seqüência de entradas em uma seqüência de saídas, enquanto foca sua atenção em partes importantes do contexto em torno das entradas. Os transformadores não dependem convoluções ou redes neurais recorrentes.

O potencial de automação técnica refere-se à parcela do tempo de trabalho que pode ser automatizada.
Avaliamos o potencial técnico para automação em toda a economia global por meio de uma análise das atividades componentes de cada ocupação. Usamos bancos de dados publicados por instituições como o Banco Mundial e o Bureau of Labor Statistics dos EUA para quebrar os dados e reduzimos cerca de 850 ocupações em aproximadamente 2.100 atividades, e determinamos as capacidades de desempenho necessárias para cada atividade com base em como os humanos executam atualmente elas.

Os casos de uso são aplicativos direcionados a um desafio de negócios específico que produz um ou mais resultados mensuráveis. Por exemplo, em marketing, a IA generativa pode ser usada para gerar conteúdo criativo, como e-mails personalizados.
Dados semi e não estruturados carecem de um formato ou estrutura consistente (por exemplo, texto, imagens e áudio arquivos) e normalmente requerem técnicas mais avançadas para extrair insights.


1 visualização0 comentário

Comments

Rated 0 out of 5 stars.
No ratings yet

Add a rating
bottom of page