En

四大新功能让生成式AI“如虎添翼”

2023-12-18 人工智能

生成式人工智能(AIGC)在目前的技术领域稳居“C位”。其利用人工智能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现在AI正在生成新内容,实现从感知理解世界到生成创造世界的跃进。

过去,人们只能使用AIGC创建碎片化的内容。现在,人们越来越多地使用AIGC创建整个世界。据美国《福布斯》双周刊网站近日报道,AIGC技术领域正在喷涌出一些令人兴奋和充满活力的新功能,为富有想象力、有趣且有潜在用处的产品、服务和体验(包括但不限于游戏创作)开辟了新机会。

人们曾使用生成式人工智能创建碎片化的内容。现在,人们越来越多地使用生成式人工智能创建整个世界。图片来源:美国《福布斯》双周刊网站

深度学习加聊天

近年来,随着AI技术的不断发展,聊天机器人在各个领域逐渐成了“香饽饽”,也成了人们非常喜欢的交互方式。基于深度神经网络的聊天机器人更是成为了研究热点。

这些聊天机器人由深度机器学习提供动力,但灵感来自人类大脑结构。在训练过程中,超级计算机会读取大量文本并进行训练,这种训练使聊天机器人能够在对话中结合上下文语境,产生类似人类的文本响应。

目前,智能客服聊天机器人集成了这项技术。随着这些机器人在语言翻译、创造性写作、理解上下文并作出有意义反应方面的能力不断增强,这些聊天机器人也可成为忙碌的专业人士的虚拟助理。

自然语音合成

当大声朗读文本时,许多AI机器人发出的声音听起来不自然且令人不舒适。但科学家现在可利用文本-语音软件领域的一些新工具,创建听起来更加自然而舒适的合成语音。

例如,AI文本转语音公司ElevenLabs推出了AI配音功能,可将口语内容转换为另一种语言,同时保留原说话者的声音、语言模式、情感和语调。这款流行且功能强大的语音生成器让任何人都可创建专业的画外音。

这些工具可将文本转换为具有不同声音、风格和语言的优质音频,有望在电子游戏和娱乐行业大显身手,为其中的动画角色赋予独特的配音。它还可与其他技术,例如神经语言模型聊天机器人相结合,为用户与名人进行“对话”创造独特且逼真的体验。

图片创作编辑

有了新的AIGC图片编辑工具,人们可做的将不再限于在照片上贴有趣的猫耳朵。

AI应用程序EPIK可让用户生成怀旧的、90年代风格的照片。与其他最近流行的AI应用程序类似,EPIK的工作原理是让用户首先上传一系列自拍照,然后EPIK使用这些自拍照生成复古年鉴照片。近期,随着来自世界各地的名人开始在社交媒体上分享EPIK生成照片,该应用程序10月飙升至苹果应用商店的榜首。

EPIK并非第一个因奇妙功能而走红的AI照片应用程序。此前,Lensa和Remini等产品也风靡一时,Lensa提供AI生成的“魔法头像”;Remini则因其专业外观的AI头像而在今年夏天登上苹果应用商店榜首。

简而言之,这些新工具生成上传照片的超现实版本,且拥有一系列风格,如复古、优雅、运动等。这些照片编辑工具显然也可应用于游戏、电影、平面广告或任何依赖人类图像的东西。

AI情感陪伴

AI情感陪伴是指利用自然语言处理技术,来模拟、理解、表达和满足人类的情感需求,从而提供给用户一种类似于人类之间情感交流和支持的体验。基于此类工具创建的模型,能真实而富有同情心地与人类讨论思想和感受,进行角色扮演,帮助管理用户的焦虑情绪。

当然,仍有很多人对与AI建立更加亲密的关系感到不舒服,但开发人员断言,这些工具可帮助用户更好地学习社交技能,体察自己的情绪或思维模式,管理自身的压力,并努力改善情绪健康。

此外,鉴于这些AI模型能模仿人类的声音、言语模式、外表甚至性格,潜在用户担心别有用心之人利用这些工具实施欺诈、身份盗窃或其他犯罪行为。而这正是业界仍在努力解决的问题。

《福布斯》网站强调称,通过严格的身份验证,例如双因素认证、视网膜扫描、政府对数据隐私实施的严格规定,以及用户更谨慎地与AI平台共享某些数据,上述AIGC工具有望在未来安全有效地为用户提供一系列极具创新性且极有用的功能。

来源:科技日报