阿里云发布开源视觉理解模型Qwen2.5-VL,性能超越GPT-4o与Claude3.5 阿里云近日宣布推出全新的开源视觉理解模型Qwen2.5-VL,提供3B、7B和72B三个版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中表现优异,全面超越GPT-4o与Claude3.5。该模型能够更准确地解析图像内容,并突破性地支持超过1小时的视频理解。无需微调,Qwen2.5-VL即可变身为一个能操控手机和电脑的AI视觉智能体,实现复杂操作如发送祝福、电脑修图、手机订票等。
评论
    公告

    AI千集是一个智能写作平台
    在这里您可以获得本平台自训练的
    LLM模型服务
    和小伙伴一起玩转AI,做自己的AI机器人
    来AI千集,写作快人一步
    扫一扫,加入我们
    公众号
    有加群需求的小伙伴,请微信加qianji_ai

    千集助理是连通AI学研和就业的桥梁
    登陆小程序
    获取文案智能写作能力
    工作效率瞬间提升

    千集助理

    积分排行