中文 AI 观察家 xiaohu 5 月 10 日分享一个结合 GPT 与 Gemini 3.1 Pro 的工作流示例:先用 GPT 生成图像、再用 Gemini 3.1 Pro 把图像转换为 3D 互动内容、可把任何知识主题做成可旋转、可操作的科学应用。xiaohu 推文展示的示例包括 3D 行星展示、互动科学模型等、是「跨模型工作流」(multi-model workflow)的具体实践。
工作流结构:GPT 生图 → Gemini 3.1 Pro 3D 化
整个工作流的两阶段设计:
阶段一:用 GPT(GPT-image-1 或 ChatGPT 内建的图像生成)产出主题图像、提供视觉基础
阶段二:把图像输入 Gemini 3.1 Pro、由 Gemini 把 2D 图像转换为 3D 互动内容
输出形式:可在浏览器内旋转、缩放、互动的 3D 物件
适用场景:科学教育、产品展示、知识互动内容
「跨模型工作流」是 2026 年 AI 应用层的关键趋势之一—单一模型不再是万能工具、开发者把不同模型最强的部分串接起来、做出单一模型做不到的应用。
具体展示:3D 行星、互动科学内容、机器人工具售货网站
xiaohu 同步发布的多个示例:
3D 行星展示:可旋转的太阳系或单一行星模型
互动科学内容:把抽象知识做成 3D 可视化、适合教育用途
机器人工具售货机未来网站:用 GPT 生图加上 Tripo 3D 平台、做出展示型网页
这些示例的共同特征是「视觉生成 + 互动转换」—GPT 负责创意视觉、Gemini 或其他 3D 工具负责把静态图像转成可操作的互动形式。每一段单独拿出来都不算新,但串接后的最终体验比任何单一工具强。
意义:跨模型工作流逐渐成为主流开发模式
对开发者的具体启示:
选对工具比选最强模型重要—GPT 强的视觉、Gemini 强的多模态理解、Claude 强的长 context、各有各的甜蜜点
模型 API 整合成本下降、串接多个模型在实作层级变得可行
新型应用很可能是「多模型 pipeline」、不是「最强单一模型」的延伸
本案的价值不在技术突破、而在工作流设计的模板
后续可追踪的具体事件:Gemini 3.1 Pro 的 3D 生成能力是否被 Google 在后续活动正式公告为产品功能、跨模型工作流是否在 LangChain/LlamaIndex 等框架中取得预设模板支持、以及商业化案例(如教育、电商、行销)的具体采用示例。
这篇文章 xiaohu 示范跨模型工作流:GPT 生图 + Gemini 3.1 Pro 转 3D 互动内容 最早出现在 链新闻 ABMedia。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复



