◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
8月15-18日,第十九届全国人机语音通讯学术会议(NCMMSC2024)暨中国计算机学会语音对话与听觉专委会(CCF TCSDAP)学术年会在新疆乌鲁木齐拉开帷幕。捷通华声作为人工智能企业代表,受邀出席并发表“基于多模态Agent智能体的增强人机交互产业化”主题演讲。
本次会议由中国计算机学会与中国中文信息学会联合主办,是语音技术领域最具影响力的学术盛会。来自全球的专家学者、行业领袖以及从事语音技术相关行业的科技企业汇聚一堂,共同探讨语音科技的最新发展趋势和广阔应用前景,为推动语音技术的持续创新与蓬勃发展添砖加瓦。
在AI大模型时代,人们迎来了全新的机遇。各行各业通过将大模型的强大理解和生成能力深度嵌入实际业务场景,来提升服务质量和效率,并已在多个领域取得显著成果。例如,在工业领域,可以利用大模型进行设备状态预测和故障诊断,提高生产效率和安全性;在医疗领域,智能体可以辅助医生进行精准诊断和个性化治疗方案的制定。
在行业用户开展“人工智能+”的行动中,Agent智能体是将AI强大能力转化为实际应用的关键。Agent智能体不仅能理解和生成自然语言,还可以感知环境、推理和执行复杂的操作,从而将大模型的广泛知识和推理能力有效应用到实际问题的解决中,如智能客服、智能办公、数据分析等领域。
人机交互是当今AI应用领域非常重要的一个方向,随着大模型的发展,基于统一的多模态感知大模型成为可能和趋势。Agent智能体通过融合多模态AI能力,能够理解来自不同数据类型(如语音、文本、图像)的信息,更好地与人类用户进行更自然的交互,并将自然语言和外部物理世界的丰富的感知连接在一起,准确理解和响应用户需求。人机交互模型正由传统的图形界面、简单的语音输入输出转向更自然的交互方式。
捷通华声作为致力于通用人工智能(AGI)发展的技术与服务提供商,构建了以自主研发的对话式AI、音义感知、计算视觉、大模型等数十项核心技术成果为基础,以智能知识库为支撑的Agent智能体应用中台。通过智能体自动处理和分析多源数据,实时生成优化策略,提高业务流程的自动化水平,并根据实时情况动态调整和优化任务执行,确保整体系统的灵活性和响应速度,最终推动企业的数字化转型和智能化升级。
捷通华声Agent智能体应用中台同时预置全智能客服、智能会议、写作助手、指标分析等多种智能体组件,用户可以根据需要直接使用,并支持以低代码、可视化方式进行智能体开发。同时支持结果反馈、多Agent交互、快速链接企业知识,来确保Agent智能体执行各类任务所需的技能及执行效果,推动企业的数字化转型和智能化升级。
随着技术的不断进步,智能体将变得更加智能、通用且个性化,能够处理更多复杂的业务场景,并与人类员工协作无缝对接。捷通华声将继续专注人工智能核心技术研发与产业化应用,通过构建垂直领域大模型和Agent智能体,融合多模态AI技术,不断丰富产品形态,提升产品效能,为未来的数字化企业提供强有力的支持。
关于第十九届全国人机语音通讯学术会议
全国人机语音通讯会议自1990年创办以来,已经成功举办了十八届,逐渐打造成国内影响力最大的语音研究领域盛会之一,为广大专家、学者和科研工作者交流研究成果提供了重要平台,促进了语音研究领域的不断进步。
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
工作时间:8:00-18:00
电子邮件
扫码二维码
获取最新动态