1、OpenAI Agent 数据抓取能力测试报告2025.08.01郎瀚威/GPTDAO猫猫头AIwatch.ai2aiwatch.ai 01目录10LinkedIn UX设计师招聘02关于作者11结尾03测试感受12附件04测试结果1305旧金山政府预算数据分析1406Epic公司潜在客户开发1507100款运动鞋对比矩阵1608医疗健康创业公司融资分析1709YouTube Genspark视频分析182025/8/1目录目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘3aiwatch.ai 2025/8/1关于作者作者郎瀚威及团
2、队,郎瀚威现居美国硅谷Palo Alto,GPTDAO分析师,第二作者猫猫头,也在硅谷,小红书:107279551更多数据内容请关注公众号:郎瀚威Will,新闻资讯请关注推特:financeyf5 获取更多信息官网飞书:https:/aiwatch.ai/;GenAI网页数据2025Q1报告:链接加数据报告群:下方企业微信扫码,备注加Will的数据报告分享群,请简单自我介绍,仅用于讨论行业数据,发广告会飞机。商务合作洽谈,请加微信lang2057,请备注公司信息,因为作者微信已经满了服务包括:1对1推特增长咨询服务等。数据库服务,包含对于市场上产品的详细跟踪和打标,了解商机先人一步。咨询服务包
3、含专业团队对于公开数据的收集,调研,增长分析等,4000美元/月。推特增长顾问服务,分析欧美竞对,构建推特增长路径。价格同上。Will小助手企业微信进不去群扫这个微信公众号数据报告群21群满了可以加目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘4aiwatch.ai 2025/8/1测试Prompt执行结果表格目录|作者|测试感受|旧金山数据查找|客户开发|运动鞋对比|医疗创业公司|Genspark视频分析|设计师招聘序号Prompt简述来源一句话总结1旧金山政府预算数据分析OpenAI五年预算数据表格2Epic公司潜在客户开发G
4、enspark提供特定条件的潜在客户3100款运动鞋对比矩阵Manus比较100款运动鞋4医疗健康创业公司融资分析Genspark列出特定条件的公司5YouTube Genspark视频分析Genspark查找 20 个Genspark视频6LinkedIn UX设计师招聘Genspark寻找特定条件的设计师100ManusProGenspark4107OpenAIAgent58200202020123301091005aiwatch.ai 2025/8/1报告一些Takeaway-by郎瀚威Manus在今天launch了自己的Pro plan,主要prompt场景为数据抓取和图片设计。正好我
5、们之前没测过数据抓取。与是就启动了这次任务。为什么是测试数据抓取?因为根据我个人经验,公司员工用这个功能做市场调研,其刚需程度大于图片抓取。比如销售找线索leads,比如调研竞品公司等等。大家可以仔细看看原Prompt,条件其实还挺苛刻的。市场进化非常快,大家功能上你追我赶,技术路线,效果上也是如此。今天的效果不代表明天的效果。另外测试员工评价的,仅代表其个人观点和感受,大家看看一乐得了。幕后花絮:这次任务一波三折。我们看到Manus发布新功能,就计划开始测试,从硅谷时间下午就开始了。把所有任务跑出来,文件下载等等,一开始,和上次分析PPT一样,用大模型评测结果。结果比较奇怪。一开始不同人测试
6、分数不同,后来发现同一个人测试分数也不同。这时候已经硅谷半夜1点了。我们紧急开会讨论。最后回归到只计算数量,不评价的这个状态。中间还多人反复跑了下几个任务。由于时间仓促,没有精调测试评价Prompt,可以说是被自己的不小心和LLM幻觉小坑了一回。不过最后好歹算是在硅谷时间早上5点收尾力挽狂澜。因此本次测试的定位,就是给大家当一下基础设施,帮大家跑一下任务,做一回远程公共牛马。本次6个任务,Manus花了约2300点数,平均每个任务300-500左右。Prompt看板开源(到Notion:链接)6aiwatch.ai 2025/8/1测试感受by 猫猫头Manus在今天launch了自己的Pro