明星换脸av

日本信息与系统研究机构Jin-Dong Kim作《大语言模型与文本挖掘:通过工具集成扩展功能》学术报告
发布日期 2025-11-11 浏览次数

(图文|何艳红 编辑|信息 审核|夏静波)11月10日下午,明星换脸av 在一综B316举办了题为“大语言模型与文本挖掘:通过工具集成扩展功能”的学术报告。

报告人Jin-Dong Kim博士来自日本信息与系统研究机构(ROIS)研究院,为生物医学自然语言处理(BioNLP)领域知名学者。报告中,Jin-Dong博士从“工具集成”角度出发,探讨了如何通过“Function Calling”机制让大语言模型实现功能扩展。他指出,当前研究正从传统“纯文本生成”转向“模型与工具协同”新阶段,使LLM(Large Language Model,大型语言模型)能主动调用外部知识库、API服务或可视化平台,实现知识检索、语义比对与智能操作的深度融合。以其团队研发的PubDictionaries平台为例,Jin-Dong博士详细介绍了该系统的架构与功能。PubDictionaries是一个开放式字典资源库,收录了大量生物学与医学术语的映射关系,系统结合PubMedBERT模型计算术语间的语义相似度,并通过余弦相似度完成概念匹配,用户可通过批量上传、人工录入与手动录入等三类录入方式灵活管理词条,实现自动化批量导入与人工精修的结合,从而显著提高语料的可用性与互操作性。

报告核心部分,Jin-Dong博士重点介绍了名为 Dictionarian 的工具集成框架。他指出,Dictionarian 是一个将 PubDictionaries 与 PubAnnotation 等核心资源进行整合的系统,通过支持 MCP(Model Context Protocol)协议,使其能与包括 Claude、OpenAI 在内多种大语言模型实现无缝对接。该框架允许模型直接调用词典资源,对科研文献中的句子进行自动化注释与语义标注,从而实现知识的精准链接与跨平台共享,这一机制有效扩展了大语言模型在生物医学文本挖掘中的应用边界,提升了注释结果的可解释性与互操作性。

实际应用中,Jin-Dong博士展示了2个具体案例。其一是MaizeLitBase(玉米育种文献知识库)项目,利用LLM结合语义工具,自动提取玉米育种文献中的关键概念。其二是Anatomian项目,这是一个基于FMA(Foundational Model of Anatomy)ID的人体结构三维数据库。通过与LLM集成,研究者可通过自然语言交互生成3D可视化模型,如“显示足部肌肉结构”或“高亮阿基里斯腱区域”,展示了语言模型在生命科学可视化中的潜力。

Jin-Dong博士总结指出,大语言模型的工具集成不仅能显著提升科研数据的可解释性与操作性,还为BioNLP的可扩展应用提供了新范式。然而,当前系统仍面临输出一致性、可重复性和可扩展性等技术挑战。未来研究将致力于通过标准化工具协议(MCP)与多轮聚合机制,提高模型在科研与工程环境中的稳定性与通用性。

报告过程中,参会师生围绕共同关心的问题展开了讨论。