目前常見的 ChatGPT、Gemini 等大型語言模型應用平台,背後都是多模態大模型,可以從圖像中提取文字、生成圖文。圖為用 Gemini 提取文字,大家可以玩玩看。 圖|Gemini