BlogBlogsConteúdoConteúdoGoogle Analytics

Google lança Gemini e traz novidades para o Bard com Gemini Pro.

O Google apresentou Gemini, sua mais avançada e poderosa inteligência artificial (IA), com habilidades multimodais avançadas.

Esse novo modelo revolucionário marca um avanço na tecnologia de inteligência artificial, proporcionando um desempenho de ponta em relação aos modelos de linguagem grande já existentes.

Sundar Pichai, CEO da Google e da Alphabet, destacou que a inteligência artificial está gerando uma transformação tecnológica significativa, que pode ultrapassar o impacto das revoluções móveis e da internet.

Ele ressaltou a importância da Inteligência Artificial na fomentação da inovação e do avanço econômico, melhorando a compreensão humana, a inventividade e a eficiência.

O que significa o Google Gemini?

Criado pela equipe do Google DeepMind, sob a liderança do CEO e co-fundador Demis Hassabis, o Gemini reflete a constante dedicação do Google em ser uma empresa que prioriza a inteligência artificial.

Estou entusiasmado para apresentar nosso trabalho em Gemini hoje! Gemini é uma coleção de modelos multimodais que mostram habilidades robustas em diversas áreas, como imagem, áudio, vídeo e texto. O nosso modelo mais avançado, Gemini Ultra, supera as expectativas em 30 dos 32 benchmarks,…

Jeff Dean, tweetado em 6 de dezembro de 2023.

O modelo possui uma ampla gama de funcionalidades impressionantes, especialmente em sua capacidade multimodal – uma característica que o capacita a processar e integrar de forma eficaz diversos tipos de dados, como texto, código, áudio, imagem e vídeo.

Variantes do Google Gemini: Ultra, Pro e Nano

Gemini 1.0, a versão inaugural do modelo, está disponível em três tipos: Gemini Ultra, Gemini Pro e Gemini Nano.

google gemini models ultra pro nano
Imagem: Peggychoucair/StockVault

Cada um dos modelos foi desenvolvido para desempenhar funções específicas: o Gemini Ultra é ideal para tarefas altamente complexas, o Gemini Pro é versátil e serve para diversas atividades, enquanto o Gemini Nano é indicado para tarefas eficientes no próprio dispositivo.

Imagem: Chakkree_Chantakad/FreeImages

Desempenho do Google Gemini: Avaliações de Desempenho de Texto

O modelo tem um desempenho excepcional, alcançando uma pontuação de 90,0% no Massive Multitask Language Understanding (MMLU), superando até mesmo especialistas humanos.

Além disso, a Gemini Ultra supera a maioria dos modelos existentes em 30 dos 32 benchmarks acadêmicos amplamente utilizados na pesquisa de modelos de linguagem de grande escala.

google gemini text benchmarks performance gpt-4
Imagem: xsix/DepositPhotos

Google Gemini: Recursos multimodais avançados e eficiência.

A abordagem única da Gemini em relação à multimodalidade a destaca dos modelos anteriores.

Os modelos multimodais convencionais frequentemente sofrem restrições devido à sua estrutura, que inclui a criação de elementos distintos para diversas modalidades e, posteriormente, a sua integração.

Por outro lado, Gemini foi desenvolvido desde o início para ser multimodal por natureza, o que o capacita a compreender e pensar em diversas entradas de forma mais eficaz.

google gemini multimodal capabilities performance gpt-4v
Imagem: TomasHa73/UnPlash

Essa habilidade coloca Gemini como uma ferramenta de grande potencial em diversas áreas, como ciência e finanças, permitindo a descoberta de informações valiosas em grandes conjuntos de dados e oferecendo análises avançadas em temas complexos como matemática e física.

Exemplos apresentados no relatório do Google DeepMind sobre o Google Gemin destacam as habilidades multimodais da Gemini, como a capacidade de criar imagens.

Imagem: Chakkree_Chantakad/Burst

No vídeo, o Google experimenta a Emoji Kitchen com o Gemini.

Ele também é capaz de trabalhar com texto, imagem e áudio, como exemplificado a seguir.

Imagem: GernotBra/KaboomPics

Este vídeo do Google fornece detalhes adicionais sobre a capacidade da Gemini para processar áudio sem edição.

Comparação da Gemini Benchmarks com concorrentes externos.

Como o Google Gemini se relaciona com os principais modelos de IA do OpenAI, como Inflexão, Antrópico, Meta e xAI? Em seguida, são apresentados os resultados do desempenho do Gemini Ultra e Pro em testes de texto em comparação com seus concorrentes.

gemini gpt-4 inflection-2 llama 2 grok 1 claude-2 performance comparison benchmarks
Imagem: karvanth/iStock

Gemini se destaca na área de codificação.

Além de suas habilidades em diferentes modos de comunicação, Gemini se sobressai em atividades de programação. Sua habilidade em compreender, explicar e criar código de alto nível em diversas linguagens de programação o coloca como um modelo de destaque para programação.

Imagem: timmossholder/Burst

Ele serve como fundação para sistemas de codificação mais sofisticados, como AlphaCode 2, o que contribui consideravelmente para resolver os desafios da programação competitiva.

A eficácia e capacidade de crescimento do modelo são melhoradas pelas unidades de processamento de tensor desenvolvidas internamente pelo Google (TPUs) v4 e v5e, o que o torna mais confiável e expansível para treinamento e utilização.

Google is testing Gemini for Search Generative Experience (SGE).

Estamos começando a testar a Gemini em Search, o que está tornando a experiência de busca mais rápida para os usuários. Houve uma redução de 40% na latência em inglês nos Estados Unidos, além de melhorias na qualidade.

Google Bard agora impulsionado pela tecnologia Gemini Pro.

Google também divulgou uma melhoria importante para Bard, ao incorporar Gemini Pro para aprimorar as capacidades da inteligência artificial.

Imagem: GernotBra/iStock

Essa atualização representa a mais significativa melhoria que Bard já recebeu até o momento.

O Gemini Pro passou por melhorias no Bard visando aprimorar consideravelmente sua capacidade de compreender e resumir informações, raciocinar, codificar e planejar.

Imagem: Peggychoucair/DepositPhotos

Os clientes agora têm a oportunidade de testar Bard com tecnologia Gemini Pro para interações por meio de texto, com a intenção de incluir suporte para outras formas de comunicação em breve.

Impulsado por Gemini Pro, @Google Bard comparte las mejores herramientas gratuitas para aprender sobre SEO.

— A publicação foi feita por Kristi Hines em 6 de dezembro de 2023.

No início, lançado em inglês em mais de 170 países e territórios, em breve essa atualização estará disponível em mais idiomas e regiões, incluindo a Europa.

Entender o material usando Gemini para uma experiência do usuário personalizada.

Este vídeo mostra como a Gemini é capaz de compreender o que o usuário deseja e desenvolver experiências personalizadas para ele.

Inicia-se pelo entendimento do propósito do utilizador e pela recolha de informações pertinentes antes de conceber e desenvolver uma interface personalizada para a exploração.

O utilizador pode interagir com a interface e obter informações adicionais de acordo com as suas necessidades, demonstrando a capacidade da Gemini de se ajustar e proporcionar uma experiência personalizada.

Apresentação multimodal utilizando a tecnologia Gemini.

No site do Google para Desenvolvedores, você verá demonstrações de como o Gemini é utilizado em prompts multimodais.

A promoção multimodal é uma abordagem de comunicação com sistemas de inteligência artificial que consiste em oferecer diferentes tipos de dados, como texto e imagens, e obter previsões do sistema em resposta.

Este método de instrução utiliza tanto instruções escritas como imagens para abordar uma ampla gama de atividades, desde resolver quebra-cabeças lógicos até compreender sequências de imagens.

Ele auxilia Gemini a adquirir competência em identificação de padrões e aprimorar suas habilidades de pensamento crítico.

Em campos como o desenvolvimento de jogos ou a criação de playlists musicais, a abordagem multimodal auxilia na programação e na geração de respostas que combinam texto e imagem.

A possibilidade de se conectar com diferentes ferramentas e programas revela oportunidades para uso prático em áreas como design, programação e produção de conteúdo.

O Google Pixel 8 Pro é o pioneiro em smartphones com inteligência artificial integrada, impulsionado pela tecnologia Gemini Nano.

A mais nova atualização do Google apresenta o Gemini Nano, um avançado modelo de inteligência artificial, agora incorporado no smartphone Pixel 8 Pro.

Essa nova versão destaca o Pixel 8 Pro como o pioneiro em smartphones com foco em inteligência artificial, usando o Gemini Nano em conjunto com a tecnologia Google Tensor G3.

As características principais incluem a função “Resumo no Gravador” para resumir gravações de áudio no dispositivo e a função “Resposta Inteligente no Gboard” para fornecer respostas de texto contextualizadas. Essas funcionalidades melhoram a privacidade e a experiência do usuário sem depender de uma conexão de internet.

Além disso, o Google revelou planos de aprimoramento para o Assistente através da experiência Bard nos smartphones Pixel, ampliando as capacidades de inteligência artificial.

A atualização traz melhorias específicas para inteligência artificial em fotografia e vídeo, como aprimoramento da estabilização de vídeo, vídeo Night Sight e Photo Unblur para imagens de animais de estimação mais nítidas.

Novas ferramentas, como a função de visualização em tela dupla no Pixel Fold, aprimoraram as chamadas de vídeo ao utilizar telefones Pixel como webcams e simplificaram a digitalização de documentos para aumentar a produtividade.

O gerente do Google agora permite o uso de senhas e os dispositivos Pixel recebem novas funcionalidades de segurança, como o Modo de reparo. O Pixel Watch possui recursos práticos de desbloqueio de telefone e rastreamento de chamadas, enquanto o Pixel Tablet apresenta a função de chamada clara e suporte de áudio espacial.

O Google está ampliando o suporte ao idioma em seu aplicativo Recorder e tornando os recursos Direct My Call e Hold for Me disponíveis em mais regiões e dispositivos.

Desenvolvimento de Inteligência Artificial com responsabilidade.

A Google enfatizou a importância do desenvolvimento de inteligência artificial responsável, assegurando avaliações abrangentes da segurança do Gemini para detectar viés e toxicidade.

A companhia trabalha em conjunto com diversos especialistas e parceiros externos para realizar testes rigorosos do modelo e lidar com possíveis riscos.

Como obter acesso ao Gemini.

O Gemini 1.0 está sendo progressivamente incorporado em diferentes produtos e plataformas do Google e em breve estará disponível para desenvolvedores e clientes empresariais através do Google AI Studio e Google Cloud Vertex AI.

No âmbito do compromisso do Google em avançar de forma responsável com a inteligência artificial, a Gemini Ultra será submetida a extensas avaliações de confiança e segurança antes de ser disponibilizada em larga escala.

A chegada de Gemini pelo Google representa um momento importante no avanço da Inteligência Artificial.

Suas habilidades avançadas, que vão desde um pensamento multifacetado sofisticado até uma codificação eficaz, marcam o começo de uma nova era na inteligência artificial, criando oportunidades significativas para a inovação em diversas áreas.

Destaque para a foto de VDB Fotos/Shutterstock.

Artigos relacionados

Back to top button