“AIGC将加速超级入口的形成”—— 基于自然语言的极简交互将替代一部分传统的图形界面交互, “no App” 理念将重塑移动互联网时代形成的入口和用户格局。应用功能会被碎片化地融入到一些超级应用中,用户通过对话就能在一个应用里直接调取、使用各种工具。
IDC的调研显示,97%的企业认可超级入口将成为未来的主流应用形态(调研对象:100家制造、医疗、互联网、金融、零售行业年收入超过5亿的大型企业)。
官方数据显示,双11期间,淘宝有超过402个品牌成交破亿,3.8万个品牌成交同比增加超100%。
这一功能的背后是阿里通义实验室自研的视频生成模型Animate Anyone。在Github上,该项目的Star数短短数日就超过1万,被认为是近期大模型领域最受欢迎的大模型算法之一。
在实验中,VCoder与开源的多模态LLMs(如MiniGPT-4、InstructBLIP、LLaVA-1.5和CogVLM)进行了比较,并在COST验证集上进行了测试。实验结果表明,VCoder在对象识别任务中表现最佳,特别是在对象计数和识别方面优于基线模型。在处理复杂场景中的对象计数和识别任务时,VCoder展现出更高的准确性,尤其是在场景中有许多实体时。