周伯文
清华大学惠妍讲席教授,上海人工智能实验室首席科学家
手机:

微信:19821197419(助理)
邮箱:

驻地:
周伯文
清华大学惠妍讲席教授,上海人工智能实验室首席科学家
个人履历:
周伯文:男,1976年10月出生,江西丰城人,清华大学惠妍讲席教授,清华大学电子工程系长聘教授,上海人工智能实验室主任、首席科学家,IEEE Fellow、中国人工智能学会(CAAI)会士,衔远科技创始人。兼任:新一代人工智能治理专家委员会委员、国家新一代人工智能发展研究中心专家委员,上海市人工智能战略专家咨询委员会委员,北京市、广州市、成都市政府科技顾问,并担任多家高校兼职教授、博士生导师,担任IEEE语音语言技术专家组成员,IEEE Transactions on Audio, Speech and Language期刊编委等。1996年获中国科学技术大学(少年班)学士学位,1999年获中国科学院硕士学位,2003年获美国科罗拉多大学波尔得分校电气与计算机工程博士学位。曾任:IBM公司美国纽约总部人工智能基础研究院院长、IBM Watson集团首席科学家、IBM杰出工程师,京东集团股份有限公司副总裁、高级副总裁、京东集团技术委员会主席、京东云与AI总裁、人工智能研究院院长,金蝶国际软件集团有限公司董事。周伯文从事人工智能基础理论和核心前沿技术的研究、应用及产业化超过20年,研究领域包括语音和自然语言处理、多模态内容理解与生成、知识表征与推理、人机对话、可信赖AI等,及其在产业化、数智化的应用。在自然语言表征学习领域提出“自注意力”和“多跳机制”等核心理念,其思想被Transformer和GAT等论文直接引用、吸收,成为自然语言、图模型和表征学习的新范式,被大量多模态表征、理解模型及应用采用;主持多项国家级、省部级重点研发项目,包括2030-新一代人工智能重大项目--“拟人化人机交互服务关键技术与系统”、国家发改委重大工程项目“面向深度学习应用的开源平台建设及应用”、两项工信部人工智能重点任务揭榜挂帅、北京市“智源-京东人工智能平台跨媒体对话”等。围绕产业数智化,周伯文教授于2018年提出了智能供应链开放平台的构想和技术路线,以京东为依托单位,规划和建设了“智能供应链国家新一代人工智能开放创新平台”并于 2019年获得科技部授牌。主持过DARPA语音翻译、Watson QA等多项重大科研项目;已发表论文百余篇,最高单篇他引超1800次,总引用近13000次,并被授予数十项国内和国际专利。2020年吴文俊人工智能杰出贡献奖获得者。
论文代表:
Trustworthy AI: From principles to practices. ACM Computing Surveys 2023/1.
Improving robustness of intent detection under adversarial attacks: A geometric constraint perspective. IEEE transactions on neural networks and learning systems. 2023/8.
Enhancing adversarial transferability via information bottleneck constraints. IEEE Signal Processing Letters. 2024/4.
Exploring adversarial robustness of deep state space models. NeurIPS 2024.
Maosong Sun, Bowen Zhou. Enhancing chat language models by scaling high-quality instructional conversations. EMNLP 2023.
CRaSh: Clustering, Removing, and Sharing Enhance Fine-tuning without Full Large Language Model. EMNLP 2023.
Sparse low-rank adaptation of pre-trained language models. EMNLP 2023.
Generative ai for complex scenarios: Language models are sequence processors. International Journal of Artificial Intelligence and Robotics Research. 2024/3.
PaD: Program-aided distillation can teach small models reasoning better than chain-of-thought fine-tuning. NAACL 2024.
On Large Language Models' Hallucination with Regard to Known Facts. NAACL 2024.
Ultramedical: Building specialized generalists in biomedicine. NeurIPS 2024.
Cogenesis: A framework collaborating large and small language models for secure context-aware instruction following. ACL 2024.
Smr: State memory replay for long sequence modeling. ACL 2024.
Large language models as biomedical hypothesis generators: a comprehensive uation. COLM 2024.
MSI-Agent: Incorporating Multi-Scale Insight into Embodied Agents for Superior Planning and Decision-Making. EMNLP 2024.
邀请老师演讲、授课请致电:19821197419 阎老师[微信同号]
免责声明:以上内容(包括文字、图片、视频)为用户上传并发布,本平台仅提供信息存储服务。如涉及版权问题,请联系我们并提供版权证明,我们将立即删除!