Neste momento, é praticamente certo: a inteligência artificial é a tecnologia que mais irá mudar a forma como vivemos e trabalhamos num futuro próximo. Desde o lançamento do ChatGPT – a inteligência artificial que parece ser capaz de responder a todas as nossas perguntas – o interesse por este e outros exemplos de inteligência artificial está a explodir.
Os especialistas do sector e os investidores já estão a esticar os ouvidos, mas também os utilizadores, as empresas e os meros curiosos começaram a seguir com interesse as tendências das aplicações baseadas na inteligência artificial.
As plataformas e aplicações de inteligência artificial não se destinam apenas a fazer-nos companhia e a responder às nossas mais variadas questões, mas irão muito provavelmente ajudar-nos de muitas outras formas: irão melhorar a experiência das pesquisas online, apoiar as empresas no atendimento ao cliente, permitir a criação e otimização de artigos, ilustrações e vídeos, sugerir códigos de programação e oferecer conselhos sobre como aumentar a produtividade nos ciclos económicos.
Mas que aplicações baseadas na inteligência artificial estão atualmente no mercado? Qual é a tecnologia que as faz funcionar? E o que fazem exatamente? Vamos descobrir pormenores e novidades sobre os produtos que já foram lançados e os que estão prestes a ser lançados.
Aqui estão todos os exemplos de inteligência artificial, aplicações e plataformas a ter em conta nos próximos meses.
- ChatGPT – atualmente o chatbot mais popular do mundo, baseado em inteligência artificial de conversação
- Google Bard – a alternativa da Google ao ChatGPT, concebida para revolucionar o mundo dos motores de busca
- Midjourney – um exemplo de inteligência artificial para criar imagens a partir de um comando de texto
- DALL-E 2 – outra aplicação de inteligência artificial de texto para imagem a ter em conta
- Writesonic – tecnologia de inteligência artificial aplicada à criação de artigos e conteúdos para as redes sociais
- Synthesia – um exemplo de inteligência artificial para criar apresentações de vídeo
- GitHub Copilot – uma aplicação que ajuda os programadores a escrever código fonte de software utilizando inteligência artificial
ChatGPT
Onde melhor começar do que aqui? ChatGPT é a aplicação de inteligência artificial que mais comentários e interesse tem suscitado nos últimos meses. O blogpost com que foi lançada em novembro de 2022 é já considerado por muitos como um acontecimento histórico para a tecnologia, a par da apresentação do primeiro iPhone em 2007.
Tecnicamente, o ChatGPT é um chatbot, ou seja, uma aplicação de inteligência artificial de conversação. A aplicação compreende a linguagem natural e responde consistentemente a perguntas colocadas pelos utilizadores utilizando a mesma linguagem. Ao ChatGPT pode ser perguntado um pouco de tudo e de uma forma completamente natural, como “Podes traduzir este texto para mim?” ou “O que é a Revolução Francesa?”. Entre os pedidos que são feitos todos os dias pelos mais de 600 milhões de utilizadores que o utilizam todos os meses, muitos dizem respeito a poemas, códigos de programação, ensaios sobre determinados temas, trabalhos do liceu ou conversas filosóficas.
O ChatGPT baseia-se atualmente no modelo GPT-3.5, uma rede neural artificial que foi treinada a partir de centenas de milhares de milhões de textos em linha. A aplicação de inteligência artificial foi desenvolvida pela OpenAI, uma empresa fundada por Elon Musk e Sam Altman, com um investimento substancial da Microsoft.
É claro que o ChatGPT, no momento em que este artigo foi escrito [março de 2023], também tem limitações. A base de dados de formação pára, de facto, em 2021: isto significa que o ChatGPT ignora o que aconteceu nos últimos dois anos. Peculiar, não é? Além disso, é uma inteligência artificial apenas de texto: não consegue compreender nem gerar imagens, vídeos ou comandos de voz. No entanto, algumas destas barreiras serão provavelmente ultrapassadas com a próxima atualização do GPT-4.
Atualmente, o software está acessível gratuitamente em linha a partir daqui, após registo. Infelizmente, devido ao elevado volume de pedidos, é muitas vezes difícil utilizá-lo.
Em resumo, o ChatGPT é:
- Uma aplicação baseada em inteligência artificial de conversação (chatbot)
- Reage à entrada de texto, fornecendo respostas articuladas em linguagem natural
- Baseia-se apenas em texto, não inclui áudio ou imagens
- Atualmente, é gratuita
Google Bard
O Google Bard é anunciado como a resposta da Google ao ChatGPT. Atualmente [março de 2023], esta aplicação de inteligência artificial ainda não foi tornada pública e só está acessível a um número muito reduzido de utilizadores.
Para já, sabemos que o Google Bard, tal como o ChatGPT, é uma aplicação de inteligência artificial conversacional, mais vulgarmente designada por chatbot. Embora ainda não tenhamos detalhes precisos sobre as suas capacidades, o Google Bard deverá ser capaz de responder de forma consistente a diferentes tipos de input dos utilizadores, sob a forma de conversação. Em particular, a Google está a trabalhar na integração do Google Bard com o seu motor de busca, de modo a revolucionar a experiência das nossas pesquisas na Internet, tornando-as mais fiáveis e mais próximas da nossa linguagem. Do mesmo modo, o ChatGPT está a ser integrado no Bing, o principal motor de pesquisa concorrente do Google.
O Google Bard baseia-se na tecnologia LaMDA (Language Model for Dialogue Applications), uma família de redes neuronais artificiais aplicadas à linguagem e desenvolvidas pela Google a partir de 2020.
Em resumo, o Google Bard é:
- Um chatbot semelhante ao ChatGPT, desenvolvido pela Google
- Foi anunciado em fevereiro de 2023, mas ainda não é público
- Irá melhorar a experiência de pesquisa do Google
Midjourney
Simplificando muito, o Midjourney é a versão de imagem do ChatGPT.
O Midjourney é uma aplicação de inteligência artificial do tipo AI text-to-image, ou seja, inteligência artificial que cria imagens a partir do texto introduzido pelo utilizador. O utilizador, por exemplo, pode pedir ao software que crie uma ilustração de uma mulher numa bicicleta ao estilo de Picasso ou uma paisagem alpina com elementos cyberpunk.
Após a primeira solicitação (o texto introduzido pelo utilizador é assim designado na gíria), a aplicação devolve quatro imagens prontas a serem processadas até se obter o resultado pretendido: por exemplo, pode pedir-se ao software que remova elementos como edifícios no fundo, que utilize um formato específico ou que aplique um estilo totalmente diferente.
A Midjourney foi lançada na sua versão beta (que continua a ser a versão atualmente disponível) em julho de 2022 por um pequeno laboratório independente sediado em São Francisco. A inteligência artificial baseia-se na aprendizagem automática e foi treinada numa enorme base de dados de imagens digitais.
Já nos seus primeiros meses, esta aplicação baseada na inteligência artificial atraiu interesse e críticas. A capa da revista The Economist de junho de 2022 foi feita com a Midjourney, enquanto o artista digital LRNZ e alguns colegas realizaram um debate cuidadoso sobre questões legais, éticas e filosóficas em torno da utilização deste tipo de inteligência artificial.
Pode ativar um teste gratuito do Midjourney ou utilizá-lo com uma licença paga. Pode aceder ao Midjourney aqui.
Em resumo, o Midjourney é:
- Uma aplicação de inteligência artificial que cria imagens a partir de texto
- Permite refazer imagens adicionando pormenores, estilos ou parâmetros técnicos
- Ainda está em versão beta, mas pode ser utilizada com planos pagos ou com uma versão gratuita
DALL-E 2
Tal como Midjourney, DALL-E 2 é uma aplicação de texto-imagem baseada em inteligência artificial.
Apresentada em 2021 pela OpenAi, a mesma empresa que detém o ChatGPT, a aplicação está atualmente na sua segunda versão, já melhorada e actualizada em relação ao software de base. A rede neural artificial que a faz funcionar foi treinada numa grande base de dados de imagens associada a um texto descritivo.
O DALL-E 2 explora assim a mesma tecnologia do ChatGPT, com a diferença de que interpreta a linguagem natural e gera as imagens correspondentes. Por exemplo, ao introduzir o comando “um gorila a jogar jogos de computador”, a aplicação gera uma imagem realista. A aplicação pode ser utilizada não só para criar uma imagem específica a partir do zero, mas também para a modificar graças a comandos de texto simples: se já não gostar do gorila como personagem, pode pedir à aplicação: “substitua o gorila por um jovem adolescente”.
Atualmente, o Midjourney e o DALL-E 2 são os dois principais exemplos de inteligência artificial de texto para imagem, pelo que será útil e interessante seguir o seu desenvolvimento para ver se são diferentes. Para já, as principais diferenças entre as duas aplicações notam-se sobretudo no estilo, com o DALL-E 2 a apresentar imagens mais fotográficas e realistas do que o Midjourney.
Pode aceder ao DALL-E 2 a partir daqui. Pode criar as suas primeiras imagens gratuitamente e comprar créditos adicionais para aumentar a sua capacidade.
Em resumo, DALL-E 2 é:
- A aplicação de inteligência artificial de referência para conversão de texto em imagem, juntamente com a Midjourney.
- Tende a ter um estilo mais realista e fotográfico do que os seus concorrentes
- Foi lançada pela OpenAi, a empresa que detém o ChatGPT
Writesonic
A Writesonic é uma aplicação baseada na inteligência artificial para criar e otimizar textos e artigos: uma espécie de copywriter digital com um motor de IA.
Utilizando modelos de Processamento de Linguagem Natural (PNL) e aprendizagem automática, a Writesonic tem como objetivo criar artigos mais ou menos complexos, conteúdos para as redes sociais e textos para publicidade online. A aplicação também utiliza a inteligência artificial para melhorar textos já escritos, por exemplo, optimizando as palavras de pesquisa ou ajudando a gerir as imagens a anexar ao artigo.
A primeira versão do Writesonic, ainda bastante rudimentar, foi lançada em 2020 pelo seu criador, o cientista informático indiano Garg Samanyou, com a ideia de combinar o potencial da inteligência artificial com a criatividade humana. Entretanto, a empresa Writesonic também criou a sua própria alternativa aoChatGPT: o chatbot Chatsonic.
Tal como o ChatGPT, o ChatSonic é uma aplicação de conversação baseada em inteligência artificial que responde a entradas textuais. No entanto, em comparação com o seu concorrente mais famoso, o ChatSonic também é capaz de responder através da geração de imagens e também compreende ordens de voz. A aplicação também foi treinada numa base de dados actualizada, ao contrário da base de dados do ChatGPT que está presa em 2021.
Pode experimentar a Writesonic gratuitamente dentro de um determinado limite de palavras, após o qual é necessário ativar planos pagos. Aqui pode aceder à aplicação.
Em resumo, o Writersonic é:
- Uma aplicação baseada em inteligência artificial para criar e otimizar artigos
- Utilizada para criar ou otimizar artigos, blogposts, conteúdos de redes sociais e anúncios
- A mesma empresa também oferece o ChatSonic, uma alternativa de chatbot ao ChatGPT
Synthesia
Synthesia é uma plataforma de criação de vídeo que se baseia na inteligência artificial. A aplicação foi criada em 2017 por um grupo de investigadores das universidades de Stanford, UCL, TUM e Cambridge.
A Synthesia funciona de forma muito simples através de um navegador: ao introduzir um texto, cria vídeos de apresentação (de momento, decididamente estáticos) em que um avatar recita o texto fornecido pelo utilizador. A vantagem para as empresas é que podem fazer muitos vídeos sem ter de envolver toda uma equipa de vídeo e empregar equipamento dispendioso, como microfones e câmaras.
Por detrás do funcionamento da aplicação está uma inteligência artificial que adapta o discurso ao movimento dos lábios dos avatares e sintetiza vozes semelhantes às naturais (aqui está um exemplo de um vídeo promocional de uma aplicação financeira).
Atualmente, no Synthesia, é possível escolher entre mais de 85 avatares baseados em actores reais e 120 línguas (incluindo o italiano, claro). Em algumas línguas, pode até variar o sotaque. Para aceder a uma demonstração ou para negociar um orçamento adequado às suas necessidades, contacte a empresa. A versão básica custa 26 euros por mês.
Em resumo, Synthesia é:
- Uma aplicação baseada em inteligência artificial para criar vídeos promocionais
- A inteligência artificial sintetiza vozes naturais e sincroniza o discurso com os lábios dos avatares
- Para solicitar uma versão de demonstração, contacte a empresa
Copiloto do GitHub
Sabia que as aplicações baseadas em inteligência artificial podem ajudar os próprios programadores no seu trabalho? O GitHub Copilot, por exemplo, é uma plataforma para apoiar os programadores na criação de código de programação: uma espécie de ajudante do programador.
Ao compilar software, a aplicação sugere ao utilizador diferentes formas de completar o código, de modo a acelerar e simplificar o trabalho do programador. O GitHub Copilot baseia-se na tecnologia GPT-3, a mesma do ChatGPT: neste caso, porém, o modelo de inteligência artificial foi especificamente concebido para compreender e gerar linguagem humana e linguagem de programação.
De momento, a aplicação não parece ir além do papel de um simples assistente e não parece ser capaz de lidar sozinha com um sistema complexo. Será que vai ter sucesso no futuro?
Pode experimentar o GitHub Copilot aqui.
Em resumo, o GitHub Copilot é:
- Um assistente baseado em inteligência artificial para compilação de código de programação
- A inteligência artificial compreende e gera tanto a linguagem humana como os códigos fonte
- Atualmente, a aplicação não parece ser capaz de lidar com sistemas complexos por si só.
E já experimentou alguma destas aplicações baseadas em IA? O que acha destes primeiros exemplos?