1、微软浏览器Copilot综合能力测试报告2025.07.29郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录10旧金山财务报告查找02关于作者11制作巴黎旅行PPT03测试感受12新加坡办公室开设研究+PPT04测试结果13奈飞电影Excel+邮件05难度分级说明14Whole Foods订购06Copilot官方发布能力15结尾07总结视频链接16附件08网球锦标赛旅行规划1709美股历史跌幅分析182025/7/29目录视频总结目录|作者|测试感受|难度分级说明|视频总结|报告|检索|PPT|表格|操作|结尾|附件信息检索PPT生成表格生成报告生成窗口操作3a
2、iwatch.ai 2025/7/29关于作者作者郎瀚威及团队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅用于讨论行业数据,发广告会飞机。商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含
3、对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群21群满了可以加目录|作者|测试感受|难度分级说明|视频总结|报告|检索|PPT|表格|操作|结尾|附件4aiwatch.ai 2025/7/29综合测试结果-中文版注释:该表格中测试结果成功与否均为人工评价,会存在人工评价与AI不一致的情况(例如Prompt下达多个指令时(输出表格+发邮件),Agent完成了部分(输出表格),AI会判定为失败,人工会判定
4、为部分成功)测试能力Copilot选择模式 综合难度结果结果结果结果结果1总结视频链接视频总结快速响应2.1部分成功成功成功失败部分成功2网球锦标赛旅行规划报告Think Deeper4成功成功成功成功成功3美股历史跌幅分析报告Think Deeper4.3部分成功成功成功成功成功4旧金山财务报告查找检索快速响应2成功成功成功成功成功5制作巴黎旅行PPTPPT生成Think Deeper3.1失败成功失败成功成功6新加坡办公室开设研究+PPTPPT生成Think Deeper4.3部分成功部分成功成功成功成功7奈飞电影Excel+邮件表格Think Deeper3.1失败部分成功失败部分成功部
5、分成功8Whole Foods订购窗口操作Think Deeper1.2失败部分成功失败部分成功失败平均时间正确/错误比例5/38/05/37/17/1 480 300 180 33 30 438 40 26 本次新增Copilot时间8 32 10 GensparkCometManus262 时间 180 729 720 300 1,560691 1,440 566 30 30 69时间时间时间113 180 360 60 420 480 300 1,440 480 300803 55 50 44 21663 14 1,500 660 1,260 27时间单位:秒OpenAIPrompt目录
6、|作者|测试感受|难度分级说明|视频总结|报告|检索|PPT|表格|操作|结尾|附件5aiwatch.ai 2025/7/29官方发布能力总表 中文版序号模块一句话描述提示词体现能力1搜索与聊天查找可租赁滑板 1、Can you find a place to paddleboard,close to work,that has afternoon rentals?2、lf its sunny,lets try for next Wednesday after work.信息检索2搜索与聊天查找酒店Which of these hotels is walkable to the beach a