1、演讲人:王晓博目 录01构筑社区力02搜索推荐融合03多模态的挑战04LLM的机会构筑社区力用户画像:追求对个人/家庭有实际价值的内容用户共性特点:购物理性、注重品质、有追求但不盲目垂类品类vv占比:时尚等内容占比最高触发/使用场景:手机信息时+空闲无聊时间时其他:陌生人互动+分享属性内容和生活方式持续扩圈,2亿人的生活经验都在小红书2022经过近11年的累计,小红书特有的真实、向上、多元的社区氛围,不断吸引着越来越多的伙伴,探索着美好生活的更多可能性NOW2020.07探索创建视频化内容社区,完成从图文到视频的转型,现在视频已成为小红书重要内容载体2021小红书月活跃用户数已经超过2亿,其中
2、70%用户是90后,并持续快速增长2023董洁直播在小红书获得成功,买手电商蓬勃发展。商业大会发布的广告模式“种草就来小红书”广阔而温暖的世界独特种草模式生活方式电商社 区电 商广 告 收藏 评论 弹幕 写笔记 点击 阅读 播放 点赞搜索和推荐关系思考关键字搜索语义搜索多模态搜索搜索个性化对话式搜索bot内容协同行为协同深度网络推荐交互式推荐生成式推荐排序互动生成普通人的视角,过来人的经验millions of monthly usersmillions of search sessionsmillions of new posts every day有用真实性用户对小红书搜索的预期实时性个性
3、化多样性Growing Content Pool生活方式类查询多意图模糊性强“火锅”附近教程好奇查找附近的餐厅?如何在家吃火锅?只是好奇,随便看看?用户意图的模糊性FrequencyHeadTail大比例的长尾查询词长尾查询召回的准确度问题长尾效应多种数据格式(标题、文本、标签、视频、图片、音乐、OCR、日志)多种笔记类型(图文笔记、视频笔记、商品笔记、直播笔记、音乐笔记)多模态数据User Intent AnalysisCandidate RetrievalCoarse-grained RankingRankingReRankAGGVector RetrievalGraph Retrieva
4、lInverted Index RetrievalLTRRelevanceQualityCTRBERTText CNNQuery Text(Word)Query Text(Word/Char)MLPQuery/User Sparse Feature AttentionUser History Queries Weighted Feature FusionQuery+User TowerText CNNNote Text(Word)Multi-modal Note FeatureNote Text(Word/Char)Note/AuthorSparse FeatureAnchorQuery Te
5、xtWeighted Feature FusionNote TowerTextCNNText CNNText CNNQ1Q2Q3BERTFrozenPretrainedEmbeddingText CNNMLPContrastive Learning(Relevance)Contrastive Learning(Engagement)Hard Negative SamplesClicked vs.Low ranking positionClicked vs.Irrelevant Similar Note MiningCosineContrastive LearningCore-wordAnaly
6、sisContrastive LearningCore word vs.other wordSimilar Note vs.RandomQuery EmbeddingNote Embedding发现页搜索作者页其他域SimilarityU2U做兴趣探索工业界的多模态OOTD秋季穿搭 毛衣通勤真的太舒服了!秋天除了西装和卫衣,怎么能少了毛衣搭配呢。毛衣的搭配可以说非常简单,穿上即可出家门那种。今天的搭配我以简单为主,并没搭配配饰,反而一切从简牛仔裤和百搭的板鞋搭配这种色系的毛衣