Klappentext

A inteligência artificial está avançando para além da compreensão textual: hoje, modelos capazes de interpretar imagens, sons e texto simultaneamente estão transformando a maneira como interagimos com máquinas. Neste livro, exploramos o poder dos Modelos de Linguagem Multimodal (MLLMs) com foco em aplicações práticas utilizando a linguagem Python e ferramentas modernas como o Hugging Face Transformers.

Por meio de exemplos claros e funcionais, como o uso do modelo BLIP (Bootstrapped Language-Image Pretraining) para geração automática de legendas a partir de imagens, o leitor aprenderá a desenvolver sistemas inteligentes que integram múltiplas formas de dados. O livro é ideal para estudantes, professores e profissionais que desejam compreender e aplicar conceitos de IA multimodal em seus projetos.

Com uma abordagem direta, prática e acessível, esta obra convida-o a mergulhar no futuro da computação — onde visão e linguagem caminham juntas para criar experiências verdadeiramente interativas e inteligentes.

Merkmale

Seitenanzahl	108
Ausgabe	1 (2025)
Format	A5 (148x210)
Einband	Taschenbuch mit Klappen
Papiertyp	Estucado Mate 90g
Sprache	Portugiesisch

Haben Sie Beschwerden über dieses Buch? Sende eine Email an [email protected]

Vitor Amadeu Souza

Doutorando em Engenharia de Defesa, Mestre em Física (CBPF), especialista em Eng.Robótica, Eng.Elétrica, Eng. Eletrônica e Eletromecânica, Eng.Telecomunicações, Eng.Controle e Automação, Eng.Biomédica, Eng.Instrumentação, Eng. Automotiva, Eng.Industrial 4.0, Eng.Dados, Eng.Computação, Eng.Software, Eng.Redes e Segurança de Dados, Eng.DevOps, Eng.Mecatrônica, Eng. Sistemas Embarcados, Eng.Manufatura, Eng.Mecânica, Eng.Acústica, Eng.Confiabilidade, Eng.Manutenção, Eng.Qualidade, Eng.Materiais, Eng.Produção, Eng. Produto, Eng.Embalagem, Eng. Transportes, Eng.Rodoviária, Eng.Suprimentos, Eng.Conhecimento, Eng.Negócios, Eng.Projetos, Eng.Energias Renováveis, Eng.Processos, Eng. Metalúrgica, Eng.Química, Eng.Ambiental, Arquitetura de Software, Cloud Computing, Machine Learning e IA, Internet das Coisas, Ciência de Dados, Full Stack, Estatística Aplicada, Bioestatística e Gerenciamento de Projetos.

MBA em Eng. Econômica, Análise de Dados e Web 3.0. Bacharel em Engenharia de Computação, Licenciado em Matemática, Física, Química e Filosofia, Analista de Sistemas e Técnico em Eletrônica, Eletrotécnica, Telecomunicações, Informática, Logística, Comércio, Administração e Meio Ambiente atuando na área de projetos elétricos, eletrônicos, automação, sistemas embarcados, firmware e software há vários anos.

Desenvolvo projetos de hardware e software voltados para as áreas industrial, automotiva, médica, científica, comercial e de automação, entre outras, sob demanda. Sou professor universitário e administrador da Cerne Tecnologia, empresa dedicada ao desenvolvimento de projetos embarcados, à comercialização de kits didáticos e à educação tecnológica nas áreas de microcontroladores (MCU), FPGA, linguagens de programação, desenvolvimento de projetos e layout de circuito impresso. Sou associado à Sociedade Brasileira de Computação (SBC), à Sociedade Brasileira de Inteligência Artificial (SBIA) e à Sociedade Brasileira de Robótica (SBR).

Ao longo dos anos escrevi vasto acervo literário técnico e científico. Alguns temas abordados: DFT, FFT, PDS, CAN, MODBUS, LIN, TCP/IP, Filtros digitais, Sistemas digitais, Sistemas de Potência, Big Data, Grafos, PID, Fuzzy, FPGA, VHDL, Verilog, CLP, DSC, DSP, ARM, inversor de frequência, soft-starter, energia solar, IoT, LoRa, Java, php, JS, REST, Spring Boot, Spark, CSS, SQL, VB, VC#, Perceptron, Robô NAO, UML, React, dentre outros.

O catálogo completo está publicado no Clube de Autores (http://bit.ly/4gwnt78).

Linkedin: www.linkedin.com/in/engvitoramadeu

Cerne Tec: www.cerne-tec.com.br

Vollständiges Profil Fale com o autor

Introdução ao MLLM Programado em Python

Von Vitor Amadeu Souza

Kategorien

Informatik, Ingenieurwesen und Technologie

Klappentext

Merkmale

Vitor Amadeu Souza