绿茶通用站群绿茶通用站群

不朽的意思

不朽的意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人(rén)ChatGPT火爆以(yǐ)来(lái),微软公(gōng)司创始人比尔·盖茨已多次公(gōng)开谈论人工智能(néng)话题(tí)。在(zài)最近(jìn)的一(yī)次采访中,他再次(cì)表示:“AI可能会让科技(jì)行业迎(yíng)来一次剧烈的洗牌”。

这个(gè)结论是他在当地时间2月20日(rì)接(jiē)受《In Good Company》节目(mù)专访时(shí)提出的。

他预期,AI的(de)发展(zhǎn)可(kě)能会威胁(xié)到谷歌的市占率(lǜ),因(yīn)为微(wēi)软(ruǎn)在(zài)AI方面的(de)行动(dòng)相(xiāng)当迅速。而最终科技巨头将把AI整(zhěng)合成用(yòng)户(hù)的“全能助(zhù)手”,包揽一切(qiè)应用,与人们进行沟通并提供建议(yì),可以(yǐ)取代(dài)亚马逊、Siri或(huò)Outlook等应用。

大(dà)佬(lǎo)口中全(quán)能助(zhù)手的(de)到来可能尚需(xū)时日,但由(yóu)ControlNet引发的又一次AI绘画(huà)浪潮,让AIGC在(zài)ChatGPT的话题热点包围中杀出重(zhòng)围。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将(jiāng)洗牌(pái)科技行业?_黑料正能量

01

ControlNet颠覆AI绘画(huà)新玩法

AIGC向可(kě)控靠近

以AI绘(huì)画为代表的AIGC上一次爆不朽的意思火的时候(hòu),还是(shì)2022年8月,在美国科罗拉(lā)多(duō)州(zhōu)举办的新兴数字艺术家竞(jìng)赛中(zhōng),一幅名(míng)为《太(tài)空歌剧(jù)院》的(de)作品获奖(jiǎng)。

随后各大厂商的AI绘画(huà)软件被(bèi)广大网友熟知(zhī)并(bìng)体验(yàn),Stable Diffusion便是其(qí)中(zhōng)代表。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能(néng)量

用户们(men)可以在应(yīng)用中输(shū)入(rù)一(yī)组(zǔ)关键词或(huò)者(zhě)一张照片,就能获得一幅(fú)AI创作的(de)画作。

作画(huà)的关键(jiàn)就(jiù)是所输(shū)入的文本(běn)。同一(yī)组关(guān)键词也可以(yǐ)创(chuàng)作(zuò)出很(hěn)多张风格(gé)不一(yī)样的画作,这让创作的过程(chéng)就像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而另一部分喜欢翻看(kàn)AI绘画的“翻(fān)车(chē)”作品。在社(shè)交媒体上(shàng),许多用户分享AI“翻车现场”,例如,一位(wèi)网友(yǒu)的小(xiǎo)狗照片(piàn)被AI画(huà)成了“肌肉男”,还(hái)有网友的个人照片(piàn)被(bèi)AI识别成了建筑。

而如(rú)今(jīn)随着ControlNet的出现(xiàn)与加持,以往AI绘(huì)画的填(tián)写关键(jiàn)词游戏可能要被颠(diān)覆了。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入(rù)可控期,将洗牌科技(jì)行业?_黑料(liào)正能量

ControlNet是一(yī)位正在斯坦(tǎn)福读博的(de)中国人张吕敏创作的一(yī)种基(jī)于控制(zhì)点的(de)图像变形算法,主要(yào)用于数字图像处理、计算机视(shì)觉和(hé)计(jì)算机图形(xíng)学(xué)等(děng)领域。

其SD插件一(yī)经(jīng)发布,在短短的两天内便成(chéng)为了AI绘画领域最新的(de)热点。

在(zài)此之(zhī)前,大家用了很多方法想让AI生成的(de)结(jié)果尽可能的符合要求(qiú),但是(shì)都不尽如(rú)人意,它的出现代表(biǎo)着AI生成开始进入真正(zhèng)的可控时期。

因(yīn)为ControlNet可以直接提取画面的构图,人物(wù)的(de)姿(zī)势(shì)和画(huà)面的深度信息等。有了它的帮(bāng)助,就(jiù)不用频繁的用提(tí)示词(cí)来碰运气,抽盲盒式的创作了(le)。

通(tōng)俗的说ControlNet相当于(yú)给AI绘(huì)画加了“魔(mó)法”,不(bù)少(shǎo)博主的(de)作品已经获得了大量的浏(liú)览量,“viggo”就是其(qí)中之一,他用朋友的照片(piàn)直接带她(tā)们走进(jìn)动漫(màn)世界。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科技(jì)行业?_黑料正能量

viggo先用(yòng)StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找到对(duì)应(yīng)的关(guān)键词;最后用(yòng)ControlNet插(chā)件绑定骨骼开始(shǐ)换关(guān)键词试效果(guǒ)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入(rù)可控期,将洗牌(pái)科技(jì)行业?_黑料正能量

通过(guò)图片(piàn)就(jiù)可以看出(chū)来,效果十(shí)分惊艳。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或进入可(kě)控期(qī),将洗牌科技行业?_黑料正能(néng)量

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

更厉害的是,除了(le)真实的照片(piàn),草图也可以加上(shàng)“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到(dào)ControlNet还能实现线稿转全彩图(tú)。大神张吕(lǚ)敏其本尊也亲自回应。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行业?_黑料正能(néng)量

不得不(bù)说当下AIGC已(yǐ)经变得越来(lái)越强大,甚至输出的作品都(dōu)已经能以(yǐ)假(jiǎ)乱真了。

02

难辨虚实,AIGC技术(shù)力(lì)爆发

警惕(tì)安全(quán)问题(tí)

近(jìn)日,“苏州金鸡(jī)湖有游艇(tǐng)party”的消(xiāo)息火(huǒ)遍网络,而经过警方辟谣这所谓的“party”可能是全国(guó)第一起AI绘(huì)图诈骗。

由于这个活(huó)动里面(miàn)给(gěi)出的(de)美女照片都是AI制作(zuò)的真(zhēn)人照(zhào)片绘图,因为(wèi)太逼真(zhēn),被大家当成真事传播了(le)

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌(pái)科技行(xíng)业?_黑(hēi)料正能量

不过仔细观察可以发现,活动发起(qǐ)者提供的照片中有个很大的漏(lòu)洞可以发(fā)现并(bìng)非(fēi)真人(rén),而是AI绘图,那便是图片中女性的(de)手指部分(fēn)有的存在(zài)异常。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

有行业人(rén)事表示:“现(xiàn)在(zài)因为手(shǒu)指部分的绘(huì)画(huà)算法比(bǐ)较复杂(zá),AI还不太会画(huà)人的手,但最新看到的图片已经有越来越完美的AI模型(xíng)出现(xiàn),以(yǐ)后可能就完全没有漏洞(dòng)了。

类似(shì)的AI作图诈骗在国外也已有发生(shēng)。据英国广播公司(sī)报道,土耳其地震期间,有Tiktok用户使用AI合(hé)成(chéng)了儿童(tóng)受(shòu)灾的假照(zhào)片发(fā)布到网络,以(yǐ)此诱(yòu)骗善(shàn)良的人(rén)打赏“捐助”从而实施诈骗。

目(mù)前随着技术发展,AIGC已经能做出真人照片(piàn)般的绘图(tú)效果,如果这(zhè)样(yàng)的图片被用来诈骗(piàn),将非常可怕。

此(cǐ)外AIGC还引发了很(hěn)多担(dān)忧,一(yī)方面,批判者认为AI在“学习”了大量前人的(de)作品之后(hòu),其(qí)创作(zuò)没有任(rèn)何(hé)情绪和灵魂,难以和人(rén)类的(de)艺术创作相提并论(lùn)。

另(lìng)一方面,AIGC背后的版(bǎn)权、目前(qián)都并没有得到有(yǒu)效(xiào)的解(jiě)决(jué),还有AIGC会不会(huì)代替人类“至高无(wú)上”的创意。

马斯克也(yě)强调(diào),人工智能(néng)的安全问题需要(yào)得到重视,太(tài)晚就来不及了。

03

AIGC下一站除了(le)视频,还有(yǒu)远方

技术(shù)都是(shì)有两面性的,潜在的危害并不(bù)能掩盖其光辉的贡献。现(xiàn)在看(kàn)来,人工(gōng)智能技术将是第四次工业革命的核心驱动力量,将创造新(xīn)的增长奇迹(jì)。

过去一(yī)年(nián),人工智能在技术(shù)和(hé)商业层面都(dōu)有(yǒu)了巨大进展,AI绘(huì)画(huà)就是人工智能技术(shù)发(fā)生方向(xiàng)性改变的一个代表。其下(xià)一站或许就是视频。

此前,Meta和谷歌先后(hòu)发布了(le)几条引爆科技圈的(de)短视(shì)频。这(zhè)些(xiē)视频(pín)引发关注(zhù)并(bìng)非内(nèi)容做(zuò)得多(duō)优秀,反而(ér)都(dōu)非(fēi)常简单,比如一匹正在喝水的马(mǎ),一只画画的玩(wán)具(jù)熊,或者一段骑摩托车的第一视角录像(xiàng),随便一个(gè)有手机的(de)人都可以随(suí)手(shǒu)录下一(yī)段(duàn)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可(kě)控期,将洗牌科技行业?_黑料(liào)正能量

但这些短视(shì)频的创作(zuò)方式(shì)非常(cháng)简单,创作(zuò)者仅仅需要向(xiàng)AI输入一段话,甚至(zhì)只是(shì)说(shuō)一下要求,AI就可(kě)以(yǐ)根据需(xū)要生成(chéng)一段视频。

谷歌发(fā)布(bù)的两个AI生成视频(pín)分(fēn)别来自于(yú)Imagen Video和(hé)Phenaki,前者主(zhǔ)要(yào)突出的是高清,与Meta的Make-A-Video没(méi)有太多的差(chà)别。

在Make-A-Video公布了AI生成的(de)视频后,AI圈就(jiù)已经玩了(le)一波梗,一个能够做出更高(gāo)清视频的(de)AI还不(bù)足以在短时间内(nèi)戳中兴奋点(diǎn)。

Phenaki更加令人震惊的地方在于,它可以制作出超过2分钟(zhōng)的连贯的也有(yǒu)确切内(nèi)容的视频(pín),这(zhè)才是(shì)真正(zhèng)让(ràng)人们感到惊喜(xǐ)的地方。因为(wèi)无论AI生成的视频(pín)多么高清,也只能是为(wèi)内容(róng)生产者提供一个灵感,一个素材,一个(gè)过场动画。

不过能够制作(zuò)出有具体剧情内容(róng)的视(shì)频就意味着,一(yī)些(xiē)视频创作由AI代替人工完成已经初(chū)步有了可能。

当下AI的发展(zhǎn)速(sù)度(dù)已经超过大部分人的想象。内容(róng)产业的本质是供(gōng)给创(chuàng)造需(xū)求,AIGC作为全新(xīn)的内容生(shēng)产(chǎn)方式,可(kě)以为内容产(chǎn)业带来(lái)更(gèng)新的内容风(fēng)格、更快(kuài)的(de)生(shēng)产(chǎn)速(sù)度,更(gèng)低的生(shēng)产成本(běn),这无疑(yí)会驱动内容(róng)产(chǎn)业的大爆发。

除(chú)了AI绘(huì)图(tú)、视频(pín),AIGC技术还(hái)能应(yīng)用于(yú)音乐、代码(mǎ)、机器人动(dòng)作等(děng)多(duō)种(zhǒng)内容形式的生成。不难(nán)发(fā)现该项技术(shù)不仅在游戏等行业能得到有效应用,对于(yú)下一(yī)代互联网各种元素的(de)构建亦有关(guān)键意义(yì)。

从商业化的角(jiǎo)度来(lái)看,文化娱(yú)乐、教育(yù)、传媒等(děng)诸多领(lǐng)域,本身(shēn)就对基(jī)于AI的可(kě)视化内容有强烈需求。

因(yīn)此,AI绘(huì)画及视频(pín)或不是结果,而(ér)只是AI进程中的一块重(zhòng)要拼图,有望在技术(shù)更新的加持(chí)下实现更大的应(yīng)用价值。

AI从(cóng)理解内容,走向了可以(yǐ)生(shēng)成内容,甚至(zhì)能够(gòu)创(chuàng)造出独立价(jià)值和独立视角的内容。AIGC的再次出(chū)圈,更(gèng)代表着未来的先进生(shēng)产力即将(jiāng)到来。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科技行业(yè)?_黑料正能量(liàng)

04

紧抓大(dà)模型与算力,牢固AIGC底(dǐ)座

从技术的发展也可(kě)以看出(chū),在语(yǔ)言大模(mó)型、图像大模型之后,多模态大模(mó)型已经成为了新的趋势。

大模型(xíng)被(bèi)誉(yù)为当前人工智能发(fā)展的智能底(dǐ)座,是全球竞争最激烈的研(yán)究(jiū)方向之一,包括谷歌、亚(yà)马逊、百(bǎi)度、阿里(lǐ)、腾讯等(děng)众(zhòng)多头部企(qǐ)业都(dōu)在竞相发(fā)力。

不过(guò)训练大模型的(de)确价格(gé)不菲,以国盛证券发布(bù)的《ChatGPT需要多少算力(lì)》报告估算,GPT-3训练(liàn)一(yī)次(cì)的成本约为140万美元。而对于一些更大的(de)LLM(大(dà)型语言模型),训练成本则(zé)介于(yú)200万美元至1200万美(měi)元高价(jià)之(zhī)间。

以ChatGPT在(zài)2023年1月(yuè)的(de)独立访客(kè)平均数1300万计算,其对应(yīng)芯片需求(qiú)为3万(wàn)多(duō)片英伟达A100 GPU,初(chū)始投入成(chéng)本约(yuē)为8亿美元,每日仅(jǐn)电费就在5万美元左右。

ChatGPT之后(hòu)又一(yī)应用(yòng)杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌(pái)科技行(xíng)业?_黑(hēi)料正能(néng)量

此(cǐ)外不(bù)论(lùn)是(shì)ChatGPT还是(shì)AIGC,都离不开庞大算力支(zhī)持。在关注各类(lèi)大模型的发(fā)展同时,更应该(gāi)关注算力网络的(de)建设。

算力网络正驱动(dòng)AI产(chǎn)业发(fā)展进入史诗级加速(sù)进程,让(ràng)AIGC及通(tōng)用AI这一(yī)人工智能发展的终(zhōng)极(jí)目标离得更近。

因为算力可以对突破性技术创新提(tí)供大力的支持。这方(fāng)面,多模(mó)态大模型是典型。作为面(miàn)向未来强人工智能(néng)、通(tōng)用人工智能的(de)重要技(jì)术创新,多模态(tài)大模型已经在人工智能领域提出了很(hěn)多年,业界也有不少技(jì)术突破,但是,多模态大模(mó)型(xíng)进(jìn)一步往下走,算力需(xū)求呈几何式(shì)上(shàng)升,一般的算力基础设施很快将(jiāng)难以胜任。

从图像、文字、语音(yīn)单独一项的(de)训练,到双模态、三模态(tài)的跃迁(qiān),让人(rén)工(gōng)智能可以(yǐ)灵活(huó)应(yīng)对(duì)不同模态的转(zhuǎn)化、像人与世界交互一(yī)样自(zì)然,这方(fāng)面,由算力网(wǎng)络来(lái)驱动将有明显优势。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

此外,还(hái)有很多(duō)需要爆发式增长的算力来支撑(chēng)的技(jì)术(shù)创新,将(jiāng)在人(rén)工智能算力网(wǎng)络支撑(chēng)下(xià)快速推(tuī)进。

AIGC已经露(lù)出曙光,期待在大(dà)模(mó)型和大(dà)算力的(de)支持下AIGC能持续颠(diān)覆内容生产(chǎn)的(de)方式,将(jiāng)创(chuàng)造的(de)边际成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 不朽的意思

评论

5+2=