Apenas poucas semanas depois de revelar seu primeiro gerador de imagens com IA, a Microsoft surpreendeu ao torná-lo acessível de graça para todo mundo. A novidade é que o MAI-Image-1 já pode ser usado no criador de imagens do Bing. A partir de agora, basta selecionar o modelo no menu e começar a criar imagens em instantes, sem custo algum.
Mustafa Suleyman, o chefão da área de IA na Microsoft, deu a notícia em sua conta no X. Ele, que também é cofundador da DeepMind, destacou que o modelo brilha em detalhes fotorrealistas, como cenas naturais, iluminação criativa e até representações de alimentos. Basicamente, você descreve o que quer ou envia uma imagem própria, e a IA cuida de aprimorar ou reinventar tudo.
De acordo com a Microsoft, o MAI-Image-1 foi desenvolvido inteiramente dentro de casa, sem depender de parceiros externos. O treinamento usou dados escolhidos a dedo e testes que espelham as demandas criativas do dia a dia. Na apresentação, eles contaram que consultaram profissionais do setor criativo para pegar opiniões e refinar o sistema.
A empresa garante que a IA lida bem com elementos visuais mais complicados. No seletor do Bing, ele é descrito como mestre em iluminação excelente, texturas e detalhes. Para provar isso, Suleyman compartilhou quatro exemplos que mostram o modelo em ação com diferentes objetos e cenários.
MAI-Image-1 não está no mesmo nível de Midjourney, mas é um grande passo
Por outro lado, o MAI-Image-1 ainda não chega aos pés do Midjourney, mas representa um avanço significativo. Testamos algo parecido e vimos que ele se sai bem, desde que você capriche nos detalhes do prompt. Em outras palavras, o contexto faz toda a diferença na geração de imagens com IA — inclua descrições completas, como tipo de iluminação ou estilo fotográfico, para resultados top.
Na prática, o MAI-Image-1 cria imagens em proporções como 1:1, 3:2 e 2:3 (iguais às do GPT-4o), e você baixa tudo com resolução máxima de 1248 x 832 pixels. Se quiser ajustar o prompt ou usar uma foto sua, vá na seção “Editar Solicitação”. Isso gera uma imagem nova, já que a IA da Microsoft não edita ou refina as já criadas.
Além do Bing, a Microsoft revelou que o MAI-Image-1 também roda nas expressões de áudio do Copilot. Esse recurso experimental transforma o conteúdo de um arquivo de áudio em imagens. Por exemplo, no modo História, a IA analisa o que ouve e produz uma visual que captura o tema ou a emoção da narrativa.
Em resumo, o novo gerador já está no ar e pode ser usado de graça com uma conta Microsoft. O único porém é que ele ainda não chegou à União Europeia , vai precisar aguardar até que as regras regulatórias sejam resolvidas.