杀疯了!豆包发布视觉理解大模型,又把价格打骨折
国内月活超过千万的 AI 应用中,豆包用户量达到5998万,位列全球第二。近日发布视觉理解模型,具备内容识别、推理和创作能力,并大幅降低价格战优势明显。
国内月活超过千万的 AI 应用中,豆包用户量达到5998万,位列全球第二。近日发布视觉理解模型,具备内容识别、推理和创作能力,并大幅降低价格战优势明显。
设计圈最近因为AI生图带中文功能而热闹起来。豆包和即梦的新功能能生成工整的中文字体图片,取代了此前几百元一张的设计费。技术难点在于汉字生成的复杂性和控制一致性的难题,豆包通过打通大语言模型(LLM)与双模态图像理解(DIT)架构解决了问题,并在细节优化上取得了显著提升。尽管如此,可商用性才是关键因素,中国市场的字体版权保护生态和商业化考量使得真正落地的产品较少。
国内首家AI生图产品豆包支持添加中文,可生成表情包、海报等多类型图片。功能包括自制抽象表情包、设计海报、生成横竖封面图及文字冒险类游戏风格的图片等。
AI产品榜(2024年11月)发布,涵盖全球、国内和出海三大榜单。亮点包括国产应用如豆包和Talkie保持高增长,ChatGPT MAU超过X(原Twitter),以及各类教育工具的波动表现等。
使用国产大模型豆包进行图像编辑时意外发现新功能——通过语音指令实现‘用嘴改图’,无需涂抹区域。该功能可直接上传图片并根据提示快速生成修改后的版本。