当前位置:首页 > 报告详情

AIGC驱动的3D场景理解及医学图像解析_李镇.pdf

上传人: 张** 编号:153042 2024-01-15 63页 6.42MB

1、ArchSummit全球架构师峰会AIGC驱动的3D场景理解及医学图像解析香港中文大学(深圳)助理教授李镇博士#page#口香港大学博士(师从余益州教授),芝加哥大学访问学者(师从许锦波教授)1讲者介绍香港中文大学(深圳)理工学院/未来智联网络研究院助理院长/教授,校长青年学者口香港中文大学(深圳)深度比特实验室主任博士后:1名,博士生:8名,研究生:2名CASP12接触图预测全球冠军,并作为AlphaFoldV1的基线方案PLOSCB2018年创新与突破奖(一年一例)人才荣誉中国科协2019年青年托举人才2022年05月CAMEO蛋白打分月度第一,2022SemancticKITTI分割竞赛

2、第一,2023CVPR李镇科研助理教授主持深港A类项目“深度学习辅助的RNA蛋白结构预测以及蛋白高亲和性RNA设计”(300学术FNII助理院长万)CCF-腾讯犀牛鸟2019优秀奖,2022年犀牛鸟专项口参与科技部国家重点研发项目合作牵头国家白然科学基金重点项目,合作牵头粤深联合基金重点项目#page#目录AIGC驱动的3D室内场景稠密描述及视觉定位AIGC驱动的3D高精度的说话人脸驱动及生成AIGC驱动的结肠镜图片生成及解析#page#案例简介300字以内进行概括性的案例介绍(突出亮点、案例独特性等)随着AIGC和ChatGPT等生成模型的迅速发展,我们探索出AIGC驱动的3D场景理解以及医

3、疗场景的分析,并通过一系列自研的算法和工具,对AIGC算法辅助的下游应用进行了深入地研究,从3D场景的自动稠密描述,到室内场景的视觉定位,再到3D视觉驱动的高保真说话人脸生成,并推广到AIGC辅助的医疗场景的解析,我们均进行了深入地探讨。在本次分享中,我们将会从3D场景描述和定位,3D说话人脸生成,生成图片辅助的肠胃镜图片解析等方面,详解介绍我们应用方案的架构设计与工程实践,同时也会基于我们的经验分享在使用AIGC驱动的3D场景理解和医疗图像理解过程中的思考和对未来AIGC演进的展望。#page#目录AIGC驱动的3D室内场景稠密描述及视觉定位AIGC驱动的3D高精度的说话人脸驱动及生成AIG

4、C驱动的结肠镜图片生成及解析#page#ICCVTRR全InstanceRefer: Cooperative Holistic Understanding forVisual Grounding on Point Clouds through Instance Multilevel Contextual ReferringZhihao Yuan 1y Xu Yan it Yinghong Liao lRuimao Zhang Sheng Wang2,Zhen Lilad Shuguang CuiiiThe Chinese University ofHong Kong GShenzhen)She

5、nzhen Research Institute of Big Data2CryoEM Center Southern University of Science and Technology#page#ICCVTRRBackground全Visual GroundingVisual grounding CVG) aims at localizing the desired objects or areas in an image or a3D scene based on an objectrelated linguistic queryImage3D ScanClose-upQuery:I

6、tisaLshaped couchinfrontofabrownentertainmentcenter.Query:first giraffeon leftScanRefer: 3D Object Localizatiion in RGB-D Scans usiing Natural Language#page#ICCVTRRBackgroundScanRefer:1. Exploiting object detection to generate proposal candidates;2. Localize described object by fusing language featu

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,本文主要介绍了香港中文大学(深圳)助理教授李镇博士及其团队在AIGC驱动的3D场景理解及医学图像解析方面的研究成果。主要内容包括: 1. AIGC驱动的3D室内场景稠密描述及视觉定位:通过实例级上下文引用,实现对点云的稠密描述和视觉定位。 2. AIGC驱动的3D高精度的说话人脸驱动及生成:利用语音/文本模态到图像模态的映射,生成与语音内容保持一致的高清说话人脸视频。 3. AIGC驱动的结肠镜图片生成及解析:使用自适应细化扩散模型(ArSDM)生成高质量的结肠镜图像,辅助临床诊断和治疗。 4. 实验结果表明,所提出的模型和方法在3D场景理解、说话人脸生成和医疗图像解析方面取得了显著的性能提升。 5. 未来研究方向包括进一步优化多模态在3D场景的解析与生成、结合video diffusion来强化说话人脸的效果以及结合condition mask来进行医疗图像场景的video diffusion生成。
3D场景理解如何利用AIGC技术? 说话人脸生成技术如何实现? 医疗图像解析如何应用AIGC?
客服
商务合作
小程序
服务号
折叠