aigc可以实现对话生成吗

aigc可以实现对话生成吗,第1张

aigc可以实现对话生成。在aigc里我们可以识别录音文字并且做出回答,通过识别的录音的内容来做相应的程序处理,实现程序的一些语音交互功能,我们可以用语音来指挥系统做一些简单的事情。

AIGC | 和父亲一起去旅行(内涵咒语)

咒语:

长镜头,后景,构图中心,父子牵手,城堡,清晨,明亮的背景,浅蓝色,柔和的色彩,柔和的光线,插图的风格,美丽的艺术,细节的设计,细节的人物设计,8k,——ar3:4

aigc的应用领域有:应用开发、金融领域。

1、应用开发

AI智能设计程序或算法,辅助人工进行应用开发。减少人工成本,提高应用开发效率。

2、金融领域

(1)金融资讯,基于算法自动编写资讯,将部分采编工作自动化。提高资讯生成速度,提高热点捕捉能力,增加资讯的时效性。

(2)虚拟客服,为金融客户提供虚拟客服咨询,降低人力时间成本,为客户提供个性化服务。

(3)数据报告,以工作量优势辅助分析师抓取数据、进行数据分析、初步的报告生成。提高数据分析的时效性、全面性、准确性,减少人工成本,提高分析效率。

aigc的特点

AIGC的特点在于它可以自动化地生成内容,不需要人类编写代码或进行大量的编程工作。同时,AIGC还可以根据用户的需求和场景,自动生成各种类型的内容,如文章、图像、音频、视频等,从而实现个性化服务和智能化管理。

AIGC的功能包括文本生成、图像生成、音频生成、视频生成、数据可视化等多个方面。其中,文本生成可以帮助企业生成各种类型的文本内容,如新闻报道、文章、简介等;图像生成可以帮助企业实现自动化监控、智能化管理和精准化营销。

音频生成可以帮助企业实现自动化客服和智能化语音助手;视频生成可以帮助企业实现自动化营销、自动化教育和自动化游戏等;数据可视化可以帮助企业实现各种类型的数据可视化,如数据报表、可视化图表、数据分析等。

运用aigc人工智能生产的内容有:文字创作、图像创作、视频创作、音频剪辑、游戏开发、代码生成。

1、文字创作

AIGC生成文字目前主要被应用于新闻的撰写、给定格式的撰写以及风格改写。比如用户可以通过输入一段对于目标文章的描述或者要求,系统会自动抓取数据,根据我们描述的指令进行创作。

2、图像创作

技术平台降低了艺术绘画创作的门槛,用户只需要通过输入文字描述,计算机将会自动生成一张作品。

3、视频创作

例如Google推出了AI视频生成模型Phenaki能够根据文本内容生成可变时长视频的技术,在公布的DEMO中,Phenaki基于几百个单词组成一段前后逻辑连贯的视频只需两分钟。

4、音频剪辑

AIGC生成音频早被应用于我们的日常生活当中,比如常用的手机导航中的声音。更深层次的应用将会是虚拟人领域,AIGC不仅可以生成虚拟人的声音,并可以创造出说话的内容。

5、游戏开发

AIGC在游戏当中的应用可分为两方面,一方面用于场景和故事的搭建,另一方面玩家可以通过AIGC的平台工具来创建自己的虚拟人,可以用于游戏中的打金等活动。

6、代码生成

资料显示,2022年AIGC发展速度惊人,迭代速度更是呈现指数级爆发,其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。

Midjourney水下古风美人

水下美人AIGC咒语    

关键词:一缸水下面一个中国古代女人穿着长长的美丽的衣服,精致的绘画,逼真的细节,富有表现力的眼睛,肖像,日本摄影,超现实主义的海洋生物,uhd图像

AIGC是Artificial General Intelligence Challenge的缩写,中文翻译为“人工通用智能挑战赛”。它是由OpenAI在2018年发起的一个挑战计划,旨在促进人工通用智能的发展和研究。

人工通用智能是指一种具有类似于人类智能的能力的人工智能系统,它可以在各种不同的任务和环境中进行学习和适应,并且可以自主地进行思考和决策。与目前的人工智能系统相比,人工通用智能更为全面和普适,具有更高的智能水平和更广泛的应用领域。

AIGC挑战赛的目标是通过设计一系列复杂的人工智能任务,来测试和评估人工通用智能系统的能力和表现。这些任务涵盖了自然语言理解、逻辑推理、视觉感知、人机交互等多个方面,要求参赛者开发出能够在这些任务上表现出色的人工通用智能系统。通过这些挑战,可以促进人工通用智能的研究和发展,推动人工智能技术的进步。

AIGC挑战赛的前景非常广阔。目前,人工智能技术已经在许多领域得到广泛应用,但是目前的人工智能系统仍然存在许多局限性和不足之处。人工通用智能的发展可以弥补这些不足,提高人工智能系统的智能水平和应用范围,从而更好地服务于人类社会的发展和进步。

虽然AIGC挑战赛目前还处于研究阶段,但是它已经引起了学术界和产业界的广泛关注和重视。未来,随着技术的不断进步和应用的深入,人工通用智能的发展将有望成为人工智能领域的一个重要方向和发展趋势,为人类社会带来更加广泛和深远的影响。

2022,风暴里的AIGC元年2022年12月16日,Science杂志发布了2022年度科学十大突破。年度热词——AIGC赫然在列。沿着我们熟悉的PGC、UGC等概念,AIGC指的是利用人工智能技术生成内容,即内容生产者从真人变成了AI。过去的一年里,火遍全网的AI绘画,震惊世人的ChatGPT,我们普通人都可以体验的各种明星级产品的问世,使得AIGC强势破圈。其实早在年初,就有行家预测:2022年是AIGC元年(当时我们用得更多的另一个词是“生成式AI”)。今年3、4月份的时候,也有前同事想拉我入伙,向我介绍他的“虚拟数字讲解员”的商用项目,并向我描述生成式AI解放生产力之种种蓝图。但无奈于技术关卡和实现资源等难题,最终只得作罢。在困扰我们的种种技术难题当中,数字人所搭载的合成AI语音一直是我的阿喀琉斯之踵。出于我的职业惯性,我希望数字人能有自然流畅的、接近真人的嗓音,这在信息传播过程中才更富有亲和力和说服力,但现有的合成AI语音完全无法满足我的需求。在这一波AIGC浪潮里,虽然我已下船旁观,但我依然一直关注着前沿技术的发展。在2022年的最后一个月,作为首位签约TME的超写实虚拟偶像鹿晓希LUCY横空出世,并接连发布了三首不同曲风的原创单曲。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 目的地 音乐: 鹿晓希LUCY - 目的地 我该怎样去形容最初听到LUCY时的惊喜呢?我一度反复地确认:这里头,真的不是藏着个“中之人”吗?(注:中之人,指藏在虚拟主播身后、为VTuber提供声音来源的真人工作者)这明明是如假包换的真人歌手嘛!这怎么还会是AI啊?‌今天,我便和大家聊聊,在2022这一“AIGC元年”里,推出的又一颗璀璨新星:首位拥有“唱片级智能歌声”的虚拟偶像——鹿晓希LUCY。虚拟歌姬的前世今生AI歌手其实并不是什么新鲜事。2004年,YAMAHA便正式推出了电子歌声合成软件,输入音调和歌词,就可以合成类似人类声音的歌声,这就是大名鼎鼎的VOCALOID,国内俗称的“V家”。合成语音的原理听起来很简单:通过采集大量的人类声音样本,以神经网络合成技术,制作成音源库。玩家通过设定参数调用里头的声音,AI这就唱起歌来。在此基础上,诞生了我们熟悉的初音未来、洛天依、星尘等虚拟歌手,这都是来自于VOCALOID的技术。但,这些虚拟歌手,只要一开嗓,我们就知道——这是假人啊。尽管VOCALOID自初代发布以来,一直都在更新迭代,但依然有明显的“电音感”和“机械感”。人声是所有音源里最最难模拟的东西。我们可以轻易地在midi里模拟出三角钢琴的自然共鸣,也可以模拟出木吉他弦在指尖摩擦的声音,但人的肉嗓却是这个星球上最精密、最神奇的发音体,哪怕你把“开口度”、“明亮度”、“性别度”等参数列了个十几项,也仅仅是模拟人类唱歌的基础框架而已。所以,V家的应用范围大都仅限于二次元——反正我和三次元井水不犯河水。若干年前,我在担任女团制作人的时候,向某些二次元作者收歌,他们倒也会用VOCALOID去作为Demo歌手做范唱。收到这些Demo的时候,我的内心OS是:求求你找个妹子唱吧,V家,老板们听不懂的啦……过去数年,随着AI技术整体的提升,虚拟歌姬也有了长足的发展。以小冰为代表的x studio凭借微软的金漆招牌一时风头无量,但依然逃不开其电音质感;异军突起的ace studio倒是有越来越多的朋友使用,虽然还是能一耳朵便听得出这是AI歌手(音色气息还是缺了变化),但你若是一个作曲者/编曲人,这已经是一个相当得力的能帮你唱demo的歌手朋友了。但在鹿晓希LUCY的面前,这些技术都显得像是上个世代的产物。用各位都能听得懂的比方,LUCY就像是唯一领跑的次世代主机,把PS4 / XBOX 360等统统抛在后头。鹿晓希LUCY是怎样炼成的我相信,每一位听到LUCY的朋友都会惊讶于其革命性的声音表现力。LUCY是真正属于次世代的AI歌手。在现已发布的三首单曲当中,LUCY的声音表现自然、流畅,没有半点“机器嗓”的不适。《叠加态少女》里,在这首爽朗的Teen-Pop里,LUCY展现自己的年轻无敌,用充满了弹性和跳跃感的音色去营造19岁少女的勇敢无畏;《1234你》里,LUCY又化身为一个多愁善感的小女生,R&B对于虚拟歌姬来说总是不易拿捏,因为其音程和气息之间的控制实在是过于复杂,但LUCY的表现依然无可指摘(是一个练习时长至少两年以上的声乐学生的标准了);第三首单曲《目的地》则是带着轻摇滚/urban/City Pop的时尚曲风,这是迄今为止LUCY所发布的单曲中我最喜欢的一首,她的锐利度、冲撞感让我一瞬间感到:这个姑娘,就在我眼前。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 叠加态少女 音乐: 鹿晓希LUCY - 叠加态少女 要让LUCY“活”起来,其所要做的第一件事,是思考这个问题:鹿晓希LUCY的声音究竟是怎样的?。关于这位19岁少女,我们对她的嗓音有这样一个大致的轮廓:她留着齐肩的短发,挑染代表了自由和飘逸;她一定不是一个娃娃音,LUCY有自己的一套,带有一定的中性色彩;她的外冷内热,乍一看是酷酷的女孩,但又保持着可爱;她甚至还带有一点儿“少年感”,这让她可以展现出洒脱、勇敢的一面。在这样的人物画像的指导下,通过 TME天琴实验室LyraSinger引擎,以海量歌手样本数据的人工智能学习下,指向了属于LUCY的声音。为了满足LUCY“唱片级”的声音定位,开发团队特邀行业知名制作人文颖秋担任AI声学艺术监制,基于艺人的定位,提取采样库中多种音色亮点进行配比捏合。相比于其他人工合成语音,LUCY要求以唱片级制作流程规范样本声音标准,及专业歌手录唱标准调试和设定每一个声音细节的处理方式。最终通过精细控制各音色建模单元的比例,并吸取每种源音色的优点并有机融合,在多种比例中不断捏和,甚至对每一句歌词演绎情感及气息的不断打磨,最终生成独一无二的LUCY声纹。这也使得我们现在听到LUCY的声音是充满个性之表达能力的。 当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放 1234你 音乐: 鹿晓希LUCY - 1234你 “捏嗓”只是LUCY的第一步。第二步是LUCY的演唱技巧。你是如何理解“技巧”这件事的?我听过很多琴童的家长这样问老师:老师,我们家娃,弹琴总觉得没感情,咋整?这时候,老师大都会白家长一眼,然后说:感情?感情是什么?感情就是触键!强弱变化!句子之间的线条!这些全都是技巧!把这些技巧练会了,才有所谓“感情”好吧!对于歌手来说,同样如此。只有强大的技巧(唱功)才能支撑不同的表达。而LUCY显然是我见到过技巧最全面的AI歌手。这来源于两点。其一是LUCY的学习样本库本就是“唱片级”的。在音色样本库采集时,LUCY用的就是上百位专业级歌手的素材。这样的采集学习方式在国内非常少有。大部分开发者基于成本考虑,仅是模拟某位或某几位歌手之演唱。博取百家之长的好处不言自明,在此过程中可最大程度让AI学习到更广泛的演唱技巧,包括气声、混声、弱声、转音等多种表达,以便应对歌曲中不同场景、情绪的需要。同时也因为样本覆盖足够多,在AI的音域表现方面,从女中到女高多重音区之样本模型能提供更多可学习的范例,使得LUCY在高音区的真假音能有灵巧和高密度的回弹(这点我们稍后马上会讲到)。另一个重要的原因是LUCY在开发时所采用的史无前例的智能演唱垂类全新标注标准。数据标注是人工智能的基础。简单地说,数据标注相当于给“投喂”AI准备“饲料”。举个例子:当你在一段声音中标注“这是气声”,重复1000次不同的片段,AI在第1001次的时候便“学会了”气声的正确用法。数据标注是构建AI 歌手的基础力量,通过海量的已标注数据,AI才能逐渐学会怎么唱歌。如果标注能够越细致,那自然最后声音的呈现也能越丰满。这一次,LUCY的数据标注数量级是国内技术的佼佼者,其标注样本精细到毫秒级,事无巨细地把气声、真假音转换等多个演唱技巧维度统统标注好,以此最大程度上还原每一个人声演唱技巧。如此双管齐下,使得LUCY在音乐技法模型的能力,在广度和深度方面,都代表了次世代之水准。下面,我们不妨来细听下现已发行的三首单曲,直面感受LUCY音乐领域的强大“天赋”:《叠加态少女》:作为一首主打青春主张的Teen Pop,LUCY在这首歌其实只需要做好一件事:把她的朝气、勇往直前呈现出来就好了。说着简单,但如果没有足够声音强弱表现,这就真的是机器人唱法了。开头第一句,“伴着日落行驶向快乐”,其中“乐”字一上来就巧妙地秀了一把真假声无缝转换;“没有终点的终点更酷”,如果“酷”字把它给唱实了,这就逊毙了,此处的弱音也处理的异常平滑。进入副歌后,是一个强弱交替的重音强调唱法,每一个重拍处都要求着重强调,并在非重音下加入混声和气声,这是一个很高段位的演唱技巧,也是我们之前所说的“高音区的真假音快速回弹”能力,LUCY完成的同样精准自然。而整首歌最高音处唱到C5,基于超强引擎的全音域生成能力,依然在混声的时候合成除了高保真的声音表现,这实在是令人惊讶。 《叠加态少女》高音片段 《1234你》:这首浪漫的R&B抒情曲,考验着的是发声的细节,慢歌里特别一不小心就容易露馅。主歌时,LUCY有一些故意pitch有瑕疵的地方,“不小心塞满抽屉的秘密”,你仔细听,其实不是100%准的,但这种呼吸感恰恰又是真人歌手情绪最容易流露之处。在歌曲里的大量转音部分,如“哪怕生活其实不太识趣”之“趣”,一个字里连转了五个音,LUCY的声音也不像是同类型产品那种明显的“划线感”。以及可以留意这首歌的气口,尤其是副歌部分,LUCY每一个轻微的换气动作,这种自然的呼气吸气,来源于LUCY毫秒级的呼吸采样学习,你说谁能识别出来,这是AI?

因作品本身的乐队感很强,LUCY唱起歌来走路有风。此处可特别留意的是LUCY因为在这首歌里用了更多的真声演唱,降低了气声的使用比例,而发音也显得更为短促有力。AI不仅在参数上进行了调整,更直接导致了LUCY有另一种唱腔和情绪的表达。“唱商”,这是真人歌手才具有的本领,在过往所有的AI歌手中我都没有见到过。LUCY可谓独一家,是一个拥有音乐审美和判断的超强AI歌姬。

如上所述,鹿晓希LUCY是当前国内独一档的AI歌手存在,无愧于“唱片级发烧AI歌手”的定位。当然,LUCY目前所展现出来的领先技术也是建立在同行业无数探索者经年累月的技术积累,而当前虚拟人/数字人的领域中,竞争者层出不穷,技术也将不停地迭代。LUCY会在多长的时间里保持业内天花板的领先地位、并在此期间能够干成怎样突破性的创举(无论是商业应用或是其他异业合作),都值得我们持续观察。LUCY能为我们带来什么?以假乱真——一言以蔽之,这是鹿晓希LUCY当前呈现的状态。于是,我们能看到鹿晓希一系列高调的动作,诸如以首位“超写实虚拟偶像”的身份签约腾讯音乐,并收获了一众三次元歌手们的出道贺词,这实在是太写实了。如今的鹿晓希LUCY还是一个被保护的、“封闭状态”下的虚拟歌姬,更接近传统唱片公司/经纪公司打造下的超级新人。如出道之时便官宣与ELLE family展开深度合作,赫斯特中国为LUCY所量身打造的系列时尚大片,以系列时尚单品加身,展现其青春魅力:  

接下来,LUCY也还将作为表演嘉宾在“可口可乐粉丝节- 新年欢聚夜”及“KFC天台跨年派对”上展露头角。作为虚拟偶像而存在的LUCY确实能够获得市场的青睐,除了强调年轻时尚的快销(包括软饮、彩妆、服装)外,许多大牌也愿意加入其中,可见LUCY身上的科技感、未来感仍是品牌彰显态度及市场趋势追逐的热点。

但于我而言,我更关注LUCY依然是她身为目前唯一的可以“以假乱真”虚拟歌姬之业务能力。如果,我是说如果,在不远的将来,若LUCY成为了一个开源的AIGC音乐人,当所有人都可以对其嗓音进行使用,创作属于自己的歌曲的时候,LUCY会不会成为这个星球上最红的歌手?

请别觉得我在说梦话。大家可回忆初音未来刚诞生的时候——初音作为V家的一员,其目的也是为了解决制作人/编曲人找不到歌手的问题。因为这样一个没有气息/音高/风格限制,颠倒人类人声认知的“容器”,创作者开始了彼此的狂欢,其中甚至诞生了米津玄师这样写歌从不按常理出牌的鬼才。而当能够制作动画的MMD(MikuMikuDance)出现后,初音不再只是一个平面形象,而是可以跟着音乐舞蹈的3D动画,这让初音不仅成为音乐创作者、更是多媒体创作者的共同纽带。随着弹幕视频网站等新兴媒介的推波助澜,初音未来更是成为了全球共创的平台。因此,“初音未来之父”伊藤博之才会说:“数字作品是越被使用,其价值越高”,而创作者们在做的事,是“为没有生命的事物注入灵魂”。

对于鹿晓希LUCY来说,这位次世代的超写实虚拟歌姬,她有着超越前辈的多变音色、全面技巧,造就了她完美的拟人表现。所以,她会重新定义AI歌手吗?她会成为人人都爱用的虚拟歌姬吗?她会让创作者们连成一片吗?

The future is already here

游戏企业全面布局AIGC

步入2023年,AIGC火爆全球。国内众多游戏企业纷纷加码AIGC的背后,是AIGC对提升游戏生产效率的关键作用。行者AICEO尹学渊表示,在运用AIGC技术后,游戏研发团队只需设定最初的创意方向,然后将大部分耗时耗力的执行工作交给人工智能,形成一套“自动化完成”的生产线,以此大幅降低游戏行业的试错成本。

“AIGC的趋势已成现实,游戏厂商如想在AIGC的时代保持独特的研发优势,则一考验团队人才储备,二考验技术应用能力,即AIGC工具由谁用、用得如何。”在谈及AIGC领域的布局时,完美世界相关负责人表示,已推动公司旗下游戏工作室对AIGC进行技术培训与投入使用。通过AI技术进行智能整合,为项目打通方案,满足功能要求,如游戏中的智能NPC、场景建模、AI剧情、AI绘图等方面,对于开拓设计思路与创意灵感、提升游戏研发效率起到了很好的推动作用。

在游戏体验的提升方面,AIGC也将扮演重要的角色。中手游肖健曾表示,可以想象一下,届时开放世界RPG游戏用AI来设计NPC,所遇到的每个NPC都是依据庞大的设定库随机组合演绎而来,有着其独特的背景、性格、说话方式、真正实现千人千面,游戏体验将会变得非常鲜活生动,而这只是AIGC给我们带来的可能性的一小部分。

相关资料显示,游戏公司通过内部自建和购买服务方案等方式加强在AIGC的布局。比如,亲自下场组建AI实验室或者平台的“自研派”包括腾讯的AILab、Cros,网易的伏羲、AILab,米哈游的逆熵研究院;而沐瞳科技、龙渊网络、灵犀互娱等游戏公司则是通过采用超参数AIBot、行者AIBot以及启元世界游戏AI解决方案等方式入局。

AIGC技术有助于提升游戏开发效率,降低开发成本和开发门

游戏内AI文字生成具备较早落地潜力,有望提升游戏区分度和玩家吸引力。生成式AI在游戏内的应用已处于起步阶段,《逆水寒》手游宣布将实装国内首个游戏GPT,使NPC具备更高的自主性与随机性,提升互动真实感,《逆水寒》手游将于6月上线。AI生成、音乐等有望丰富游戏内容,提升玩家交互体验。游戏可根据玩家需求个性化定制外观、服装、场景等美术资源,自由改变游戏背景音乐的风格等。

全面助力游戏形态升级和产业变革

AIGC是非线性游戏设计的关键技术,能够实现玩家自主改变游戏流程。现阶段大部分游戏的剧情和流程采用提前预设的线性设计,AI技术的深度应用能够使游戏根据玩家偏好自动生成剧情分支、任务路线等。结合VR/AR技术,通过生成式游戏机制提供个性化的游玩体验。可通过传感器分析玩家偏好,由AI自主生成游戏剧情、场景、个性化玩法等,大幅增加游戏的互动性和沉浸感。

作为当今全球数字娱乐领域最具知名度与影响力的年度盛会之一,第二十届ChinaJoy展会以“相伴二十载越来悦精彩”为主题,将于2023年7月28日至7月31日在上海新国际博览中心举办,同期CJPlus(ChinaJoy线上展)也将迎来其全新形态,开启“线下+线上”的多元化数字娱乐嘉年华模式。

在ChinaJoyBTOB展区方面,2023年全新增设数字科技创新主题展区,顺应时势、与时俱进,将含盖当下全球数字娱乐领域中涉及5G、Web30、人工智能、元宇宙、数字人、ChatGPT、AIGC、区块链的技术及应用类产品的展示及商务交流。也代表着未来数字娱乐技术的最新发展趋势。整体展区规划面积1500平米,主办方将组织邀请国内外在前沿科技领域的创新型企业参展参观。截止目前,百度、牛信云、汉王友基、科大讯飞、巴比特、世优科技等相关领域的业界企业正在与主办方积极踊跃洽谈中。更多创新科技,尽在本届ChinaJoy!

展望未来,生成式内容改变游戏设计的底层逻辑。现阶段游戏品类如开放世界,依赖内容的堆叠和填充,生成式AI有望在开放世界自主生成新内容,丰富游戏体验。游戏与先进科技的链接一直很紧密,AIGC浪潮也将不例外,AI技术应用有望突破现有端游、手游为主的行业形态,实现游戏行业的变革。2023ChinaJoy展会现场,更多AIGC领域的相关企业与最新技术,将在这里精彩亮相,让我们共同期待!

了解ChinaJoy具体参展和赞助详情并进行相关项目预定接洽,可咨询主办方工作人员:

参展赞助

朱女士:Tomazhu@howellexponet

师先生:Shijin@howellexponet

刘女士:Emily_liu@howellexponet

杨女士:Yangyanping@howellexponet

戚先生:Weberqi@howellexponet

欢迎分享,转载请注明来源:表白网

原文地址:https://h5.hunlipic.com/biaobai/3814944.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2024-03-27
下一篇2024-03-27

发表评论

登录后才能评论

评论列表(0条)

    保存