1、晨然One2X AI全栈程师AI时代的新范式:如何构建AI产品?01020304录ONE2X介绍为什么AI产品这么难做?提示词程被极低估AI 产品团队如何构建01和我介绍ONE2X介绍嗨我是晨然2017-2021 复旦学计算机专业 本科 2021-2023 康奈尔计算机专业 硕 2023-2024.7 华为AI程师 2024.7 今 One2x Medeo product lead+AI全栈程师 我的其他身份:微电影导演、媒体Vlogger(B站UP)ComfyUI态AI内容创作者、独开发者 我既是个开发者,也是个创作者。关于ONE2XOne2x 是个产品作室 通过构建成系统为户提供更质量的信
2、息商品关于ONE2XAI动剪辑具产品让我们轻松的聊聊AI与产品认知截到20250411 A Joke02为什么AI产品这么难做?AI时代的产品和传统的产品不样的是什么?传统产品和AI产品区别是什么?传统产品是基础流程的动化 AI产品是智慧流程的动化基础流程 和 智慧流程 的区别是什么?含量基础流程是什么?基础流程是什么?所有流程可枚举 全部已知基础流程是什么?流程的动化的定义是什么,什么流程可以被SOP化,就可以做成产品。那AI产品,先肯定是产品,其次它还会完成以前类才能完成的某种任务 这个任务如果需要AI完成,那就发了范式转移智慧流程是什么?曾经的产任务的路径基本上不会在产品做之前考虑清楚,
3、AI产品需要在做之前就知道这个任务如何被完成,且需要AI做出来,意思是团队本身需要是创作者。如果你不知道这个任务(knowhow)原来是怎么做的,AI也不会做出你要的东。你得帮户做出来这个任务。举个例,CursorCursor是我认为2024年最好的AI产品Cursor是我认为2024年最好的AI产品TabCmd-KCmd-LCmd-ICursor是我认为2024年最好的AI产品TabCmd-KCmd-LCmd-I权限递增,获取信息权递增,执权递增。AI产品不仅需要为户设计使式,还要为AI设计使式权限递增,获取信息权递增,执权递增。Cursor是我认为2024年最好的AI产品Cursor Te
4、am解决了如下问题:-任务分级:根据给AI的执权限不同的不同可控颗粒度的任务-帮户完成了任务:每个任务/功能在户还没来之前就已知该任务如何完成(Coding,且论语,论项)-交互式:每个任务/功能与协同的机交互式那怎么能提前帮户完成任务?03提示词程被极低估提示词程被极低估认知:Prompt也是代码,所以要测试。认知:AI产品就是基于“给模型提供上下”出发开始的认知三:如何向未来进设计,避免被模型更新所冲击?认知:Prompt也是代码,先应该放起尊重prompt,同代码享受同等权利,需要git diff 需要对prompt单独进版本管理认知:Prompt也是代码,但有区别?LLM和函数很类似,
5、它们都是实现某个“计算”的节点。但它能提供传统函数能做的更多的事情,提供“智慧类型”计算。它可以接受结构化的数据,经过推理,输出结构化/结构化的数据。认知:Prompt也是代码,如何测试?函数,我们在运前,通过IDE或者单测即可完成功能正确性校验。LLM怎么测试呢?认知:Prompt也是代码,如何测试?如果你只是让它完成传统函数的任务,也很好测试,可以使function call 加上单测。如加法任务,只让它输出结果,可以做正确性校验。但概率你让LLM做的事情是结构化的。所以Prompt的好坏怎么测?:格式正确性使function call/Json mode确保输出格式不出错任何LLM相关的
6、调,都使pydantic严格校验所以Prompt的好坏怎么测?:功能Baseline输出内容,通过batch evaluation进校验。所以Prompt的好坏怎么测?三:评测结果模型的上限,还是取决于对于结果的要求有多。Baseline只是保证功能正常运,上限在于“”所以Prompt的好坏怎么测?四:放权模型可能你想象中的更强,不要限制它的思考向,思考内容,knowhow,把prompt当成种容器,你只是为模型提供必要的信息,不是教它如何思考。总结下,Prompt也是代码,所以要测试。认知:AI产品就是基于“给模型提供上下”出发开始的先,不要发现模型做