资讯 | AI千集

代码改变世界！

1天前

阿里云发布开源视觉理解模型Qwen2.5-VL，性能超越GPT-4o与Claude3.5 阿里云近日宣布推出全新的开源视觉理解模型Qwen2.5-VL，提供3B、7B和72B三个版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中表现优异，全面超越GPT-4o与Claude3.5。该模型能够更准确地解析图像内容，并突破性地支持超过1小时的视频理解。无需微调，Qwen2.5-VL即可变身为一个能操控手机和电脑的AI视觉智能体，实现复杂操作如发送祝福、电脑修图、手机订票等。