ChatGPT文本生成图片功能升级准确生成文字提升商用价值

2025-03-26 08:00

OpenAI对ChatGPT进行历史性升级，新增图像生成功能，简化图像编辑和视觉效果创建，扩大聊天机器人应用范围。

OpenAI的ChatGPT图像生成功能升级，增强企业与个人用户吸引力

OpenAI宣布对ChatGPT的图像生成功能进行历史性升级，使其在图像编辑和为冗长、易读文本创建视觉效果方面更加便捷。这一升级有望扩大聊天机器人在企业和日常用户中的吸引力。

在周二的直播活动中，OpenAI展示了用户如何通过与ChatGPT对话来优化图像。该公司表示，ChatGPT将能够更准确地创建具有连贯文本的图像，特别是在为专业用途提供图表、信息图表和徽标方面。AI已经能够根据提示词大致准确地生成图像中的文本，例如生成一整页的讲话文本，且没有错别字。

OpenAI正将ChatGPT定位为集搜索引擎、语音助手和视频生成器于一体的全能应用。随着最新改进，OpenAI试图整合更先进的图像功能，这些功能既适用于个人也适用于专业用途。这也可能帮助ChatGPT保持领先于竞争对手的聊天机器人，如埃隆·马斯克(Elon Musk)旗下的xAI，后者也增加了图像生成器。

然而，与其他人工智能应用一样，ChatGPT在生成图像时可能会编造一些不实内容，例如在图片上包含带有假国家名称的文本。OpenAI在其博客文章中提到，这些错误可能会在用户不太详细的提示下发生。同时，该公司也承认其人工智能在创建小尺寸文本和非拉丁字母文本上存在困难。

根据OpenAI的博客文章，使用更新后的功能生成图像需要大约一分钟的时间。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在直播中解释，由于图像更详细，因此需要更长的时间。

新功能将于周二通过OpenAI的GPT-4o模型提供，该模型对免费和付费用户开放。该公司表示，将在未来几周内向使用其应用程序编程接口的软件开发人员推出这些新功能。