绿茶通用站群绿茶通用站群

灰姑娘作者是安徒生还是格林

灰姑娘作者是安徒生还是格林 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软公司创始人比尔·盖茨已多次(cì)公开谈论人(rén)工智能话题(tí)。在最近的(de)一次采访中,他再次表示:“AI可能会让科技行业(yè)迎来一次剧烈的洗牌(pái)”。

这个结(jié)论是(shì)他在当地时(shí)间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预(yù)期,AI的发(fā)展可能会威胁到谷歌的市占率,因为微软(ruǎn)在(zài)AI方面(miàn)的行(xíng)动相(xiāng)当迅速。而最终科技(jì)巨头将把AI整合(hé)成用户的“全(quán)能助手”,包揽一切(qiè)应用,与(yǔ)人们进行沟通并提供建议,可以取代亚马逊(xùn)、Siri或Outlook等应用。

大佬口中全(quán)能助手(shǒu)的到来(lái)可(kě)能尚需时日,但(dàn)由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中杀出重围(wéi)。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入(rù)可控期(qī),将洗牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表(biǎo)的AIGC上一次爆(bào)火的时候(hòu),还是2022年8月(yuè),在美国科罗拉多州举办的新(xīn)兴数字艺术家竞赛(sài)中(zhōng),一幅名为《太空歌剧(jù)院(yuàn)》的作(zuò)品获奖。

随后各大厂商的AI绘画软件(jiàn)被(bèi)广大网友熟(shú)知并(bìng)体验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控(kòng)期,将(jiāng)洗(xǐ)牌科技行业?_黑料正能量

用户们可以在应(yīng)用(yòng)中输入一组(zǔ)关键词(cí)或者(zhě)一(yī)张照(zhào)片,就能获得(dé)一幅(fú)AI创作的画作(zuò)。

作画的关键就是所(suǒ)输入的文本。同一组关键(jiàn)词也(yě)可以创作(zuò)出很多张风格不(bù)一(yī)样的画作,这(zhè)让创作的(de)过(guò)程就像开盲盒。

很多(duō)用户很(hěn)喜(xǐ)欢这种不确(què)定的惊喜(xǐ),他们会将(jiāng)生成(chéng)的(de)美图当做头像。而(ér)另一部分喜欢翻看AI绘(huì)画的“翻车(chē)”作品(pǐn)。在社交媒体上(shàng),许多用户分享AI“翻(fān)车现场”,例(lì)如,一位(wèi)网(wǎng)友的小狗照(zhào)片被AI画成了“肌肉(ròu)男”,还有网友的(de)个人照(zhào)片被AI识别成了建筑。

而如今随着ControlNet的出(chū)现与(yǔ)加持,以往AI绘画的填(tián)写关键词(cí)游戏可(kě)能要被颠覆(fù)了。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量(liàng)

ControlNet是一位正(zhèng)在斯坦福读博的中国人(rén)张(zhāng)吕敏创(chuàng)作的(de)一(yī)种基于控制(zhì)点的图(tú)像变形算法(fǎ),主要用于数字图像处理、计算机视觉和(hé)计算机图形(xíng)学(xué)等领域。

其SD插(chā)件一经发(fā)布,在短(duǎn)短的两天内便(biàn)成为了(le)AI绘画领域最(zuì)新的热点。

在此之前,大(dà)家用了很多方(fāng)法想让AI生成的结果尽(jǐn)可能的符合要求,但是都不尽如人意,它的(de)出(chū)现代表着AI生成开始进入真正(zhèng)的可控(kòng)时期。

因为ControlNet可(kě)以直接提取画面的构图,人物(wù)的(de)姿(zī)势和画面的深度信息等(děng)。有了它(tā)的帮助,就不(bù)用频繁的用(yòng)提示(shì)词来碰运(yùn)气,抽盲盒(hé)式的创作了。

通俗的(de)说(shuō)ControlNet相当于给(gěi)AI绘画加了(le)“魔(mó)法”,不(bù)少博主(zhǔ)的作品已经获得了大量的浏(liú)览量,“viggo”就(jiù)是其中之一,他(tā)用朋友的照片直接带她们走进动漫世(shì)界(jiè)。

ChatGPT之后又一(yī)应(yīng)用(yòng)杀(shā)疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技(jì)行(xíng)业?_黑(hēi)料(liào)正能量

viggo先(xiān)用StableDiffusion图(tú)片转文(wén)字。

再用Text2Prompt插件(jiàn)拓(tuò)展找到对应的关键(jiàn)词;最后用ControlNet插(chā)件绑定骨骼开(kāi)始换关键词(cí)试效果。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能量

通(tōng)过(guò)图片就可(kě)以看出来,效果十分惊艳。

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业?_黑(hēi)料正能量

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期(qī),将洗牌科(kē)技行业?_黑料(liào)正能量

更(gèng)厉害的是,除了(le)真实的(de)照片(piàn),草图也可以加上(shàng)“魔法”,知乎(hū)大牛“DevPoint”和“逗(dòu)砂”介绍到(dào)ControlNet还能实现(xiàn)线(xiàn)稿转全(quán)彩图(tú)。大神张吕敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期(qī),将洗牌科技行业?_黑料(liào)正能(néng)量(liàng)

不得(dé)不说当(dāng)下(xià)AIGC已经(jīng)变得(dé)越来越强大,甚至输出的(de)作品都已(yǐ)经能以假乱(luàn)真了(le)。

02

难辨(biàn)虚(xū)实,AIGC技术力(lì)爆(bào)发

警惕安全问题

近日,“苏州(zhōu)金(jīn)鸡(jī)湖有游艇party”的(de)消息火遍网络,而经过警方辟(pì)谣(yáo)这(zhè)所谓的“party”可能是全(quán)国第一起AI绘图(tú)诈骗。

由于这个活动里面(miàn)给出的美女(nǚ)照片(piàn)都是AI制作的真人照片(piàn)绘图,因为(wèi)太(tài)逼(bī)真,被大家当灰姑娘作者是安徒生还是格林成(chéng)真事传播(bō)了

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科(kē)技行业?_黑(hēi)料正(zhèng)能量

不过仔细观察可(kě)以发现,活动发(fā)起(qǐ)者提供的(de)照片中有个(gè)很(hěn)大的漏洞可以发现并非真(zhēn)人,而是AI绘图,那便是(shì)图片中女性的手指部分有的存在异常(cháng)。

灰姑娘作者是安徒生还是格林ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入(rù)可控(kòng)期,将洗牌科(kē)技行业?_黑料正能量

有(yǒu)行业人事(shì)表示(shì):“现在因(yīn)为手指部(bù)分的绘画(huà)算法比较复杂,AI还不太会画人的手(shǒu),但最新看到的(de)图片已(yǐ)经(jīng)有越来越完(wán)美的AI模型(xíng)出现(xiàn),以后(hòu)可能就完全(quán)没有漏洞(dòng)了。

类似的AI作图诈骗(piàn)在(zài)国外也已有(yǒu)发生。据英国广播公司报道,土(tǔ)耳其地(dì)震期(qī)间,有Tiktok用户使用AI合成了儿童受(shòu)灾(zāi)的假(jiǎ)照片发布(bù)到(dào)网络,以此诱(yòu)骗善良(liáng)的人打赏“捐助”从(cóng)而实施诈骗。

目(mù)前随着技术发展,AIGC已经能做出真人照片般的绘图效果(guǒ),如果这样的图片被用(yòng)来诈骗,将非常(cháng)可怕。

此外(wài)AIGC还引发了很多担忧,一方面,批判者认为AI在“学(xué)习”了大量前人的(de)作品之后,其创作没有任何情绪和灵魂,难以和人(rén)类(lèi)的艺(yì)术创作相提并论。

另一方面,AIGC背后(hòu)的版权、目前都并没有(yǒu)得到有(yǒu)效的(de)解决(jué),还(hái)有AIGC会不(bù)会代(dài)替人类(lèi)“至(zhì)高无(wú)上(shàng)”的创意。

马(mǎ)斯克也强调,人工智能的安全(quán)问题需要得到(dào)重(zhòng)视,太晚(wǎn)就来不及了。

03

AIGC下一站(zhàn)除了视频,还(hái)有远方

技术都是(shì)有(yǒu)两面(miàn)性的(de),潜在的(de)危害并不能(néng)掩盖其光辉(huī)的贡献(xiàn)。现(xiàn)在看来,人工智(zhì)能技(jì)术将是第(dì)四次工(gōng)业革命的核心驱动力量,将创(chuàng)造新的(de)增(zēng)长奇迹。

过去一年,人工(gōng)智能在技术和商(shāng)业(yè)层面都(dōu)有了巨大进展(zhǎn),AI绘画就是人工(gōng)智能(néng)技术(shù)发(fā)生方向性改变的一(yī)个代表。其(qí)下一(yī)站或许就是视频(pín)。

此前(qián),Meta和谷歌先后发布了几条引爆科技圈(quān)的(de)短视频(pín)。这些视频(pín)引发关注并非内容做得多优(yōu)秀,反(fǎn)而都非常简单,比如一匹正在喝水的马,一只画画的玩(wán)具熊(xióng),或者(zhě)一段(duàn)骑(qí)摩托车的第一视角录(lù)像(xiàng),随便一(yī)个有手机的人都可以随手(shǒu)录下一段。

ChatGPT之后又一(yī)应(yīng)用杀疯了(le),AIGC或进入(rù)可控期(qī),将洗牌科技行业?_黑料正(zhèng)能量

但这些短视频的创作方式非常简单,创(chuàng)作者仅仅需要向AI输(shū)入一段话,甚至只是说一下要(yào)求,AI就可以根据需要生成一段视频(pín)。

谷歌(gē)发布的两个(gè)AI生成(chéng)视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是(shì)高清,与(yǔ)Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布了AI生成(chéng)的视频后(hòu),AI圈就已经玩了(le)一波梗(gěng),一个能够(gòu)做出更(gèng)高清(qīng)视(shì)频的AI还不足以在(zài)短时间内(nèi)戳中兴奋点。

Phenaki更加令人震惊的地(dì)方在于,它可以制作出超过2分钟的连(lián)贯的(de)也有确切内容的(de)视频,这才是真正让人(rén)们(men)感到惊喜的(de)地方。因(yīn)为无论AI生成的视频多么高清,也只能是为内容生产者提(tí)供一个(gè)灵感,一个素材(cái),一(yī)个过场动(dòng)画(huà)。

不过能(néng)够制作出有具体剧(jù)情内容的视(shì)频(pín)就意味着,一些视频(pín)创作由AI代替(tì)人工(gōng)完成已经初(chū)步有了可(kě)能。

当(dāng)下AI的发展速(sù)度已经超过大部分(fēn)人的想(xiǎng)象。内容产(chǎn)业(yè)的本质是供(gōng)给(gěi)创(chuàng)造需求,AIGC作为全新的(de)内容(róng)生产(chǎn)方式,可以为内容产业带来更新的内容风(fēng)格、更(gèng)快的生产速度(dù),更(gèng)低的生产成本,这(zhè)无疑会驱动内(nèi)容产(chǎn)业的大爆发。

除了AI绘图、视频(pín),AIGC技术还能(néng)应用于音乐、代码、机器人动(dòng)作等多种内容形式的生成。不难发现(xiàn)该项技术不仅在游戏等行业能得(dé)到有效(xiào)应(yīng)用,对于下一代互联网各(gè)种元(yuán)素的构(gòu)建亦(yì)有(yǒu)关键意义。

从商业(yè)化的角度来看(kàn),文化娱乐(lè)、教育、传媒等诸多领域,本身就对基于AI的可视化内容(róng)有强烈需求。

因此,AI绘(huì)画(huà)及(jí)视(shì)频(pín)或不(bù)是结果,而只是AI进程中(zhōng)的一块重要拼图,有望在技术(shù)更新的加持下实现更大的应用(yòng)价值。

AI从理解内容,走向(xiàng)了可以(yǐ)生(shēng)成内(nèi)容,甚至能够创(chuàng)造出独(dú)立价值和(hé)独(dú)立视角的内容。AIGC的再次出圈,更代(dài)表着未(wèi)来(lái)的(de)先进生产(chǎn)力即将到来。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能量

04

紧(jǐn)抓(zhuā)大(dà)模型与算力,牢(láo)固AIGC底座(zuò)

从(cóng)技术(shù)的发展(zhǎn)也(yě)可以看出,在语言大模型(xíng)、图像(xiàng)大模(mó)型之(zhī)后,多模态(tài)大模型(xíng)已(yǐ)经成为了新的(de)趋(qū)势。

大(dà)模型被誉(yù)为当前人工智能发展(zhǎn)的(de)智能(néng)底(dǐ)座,是全球(qiú)竞(jìng)争(zhēng)最激烈的研究方向之(zhī)一,包括(kuò)谷歌、亚马(mǎ)逊、百(bǎi)度、阿(ā)里、腾讯等众多头部企业都在竞相(xiāng)发力。

不过训练大模型的(de)确价格不菲,以国(guó)盛证券发布(bù)的《ChatGPT需要多少算力》报告估算,GPT-3训练(liàn)一(yī)次的成本约为140万美元。而对于一些(xiē)更(gèng)大的LLM(大型语言模型),训练成本则介(jiè)于200万美(měi)元至1200万美元高(gāo)价之间。

以ChatGPT在(zài)2023年1月的独(dú)立访(fǎng)客平均数1300万计(jì)算,其对应(yīng)芯片(piàn)需(xū)求为3万多(duō)片英伟达A100 GPU,初始投(tóu)入成本约为8亿美(měi)元,每日仅电(diàn)费就在5万美元左(zuǒ)右。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料(liào)正(zhèng)能量

此外不(bù)论是ChatGPT还是AIGC,都离不开庞(páng)大算力支持。在关(guān)注各类大模(mó)型(xíng)的发展同时,更(gèng)应该(gāi)关注算力网络的建(jiàn)设。

算(suàn)力网络正驱动AI产业发展进入史诗级加速(sù)进程(chéng),让AIGC及通用AI这一人(rén)工(gōng)智能(néng)发展的终极目标离(lí)得更近。

因为算力(lì)可(kě)以对(duì)突破性(xìng)技(jì)术创新提供大力(lì)的(de)支持。这方面,多(duō)模态大模型是(shì)典型(xíng)。作(zuò)为(wèi)面向未来(lái)强人工智能、通用人工智能(néng)的重要技(jì)术创(chuàng)新,多(duō)模态大模型已经在人工智能领域(yù)提出了很(hěn)多(duō)年(nián),业界(jiè)也有(yǒu)不少技术突破(pò),但是,多模(mó)态大模型进(jìn)一步往下走(zǒu),算(suàn)力需(xū)求呈几何(hé)式上(shàng)升,一般(bān)的算力基础设施很快(kuài)将难(nán)以胜任。

从图像(xiàng)、文字、语音(yīn)单(dān)独一项的训练,到双模态、三模态的跃迁,让人工智能可以灵(líng)活应对不同模(mó)态的转化(huà)、像人与世界交互一样自(zì)然,这方(fāng)面,由算(suàn)力网(wǎng)络(luò)来驱动将有(yǒu)明显(xiǎn)优(yōu)势。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行(xíng)业(yè)?_黑料正能量

此外,还有(yǒu)很多(duō)需要(yào)爆发式增(zēng)长的(de)算力来支(zhī)撑的(de)技术(shù)创新,将在人工智能算力(lì)网络支(zhī)撑下快速(sù)推(tuī)进。

AIGC已经露出(chū)曙光(guāng),期(qī)待在(zài)大模(mó)型和(hé)大算力的支持(chí)下AIGC能持续颠覆内容生产的方式,将(jiāng)创造的边际成本降低,让(ràng)万(wàn)众受(shòu)益(yì)。

未经允许不得转载:绿茶通用站群 灰姑娘作者是安徒生还是格林

评论

5+2=