穿着高跟鞋的女奥特曼，穿红色高跟鞋的奥特曼-绿茶通用站群

穿着高跟鞋的女奥特曼，穿红色高跟鞋的奥特曼 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天(tiān)机器人ChatGPT火爆以来，微软公司创始人比(bǐ)尔·盖(gài)茨已多次公开谈论(lùn)人(rén)工智能话题。在(zài)最(zuì)近的一次采访(fǎng)中，他再次表示：“AI可能会让科技行业迎(yíng)来一次剧(jù)烈的(de)洗牌”。

这个结论(lùn)是他在当(dāng)地(dì)时间2月20日接受《In Good Company》节目专访时提出的。

他预期(qī)，AI的发展可能会(huì)威(wēi)胁到谷(gǔ)歌的市占率，因为(wèi)微(wēi)软在(zài)AI方(fāng)面(miàn)的行动相(xiāng)当迅速。而最终科技巨(jù)头将把AI整合成用户的“全能(néng)助手”，包揽(lǎn)一切应用，与人们进(jìn)行沟通并提供建(jiàn)议，可以取(qǔ)代亚(yà)马逊(xùn)、Siri或(huò)Outlook等应用。

大佬口中全能助手(shǒu)的到来可能(néng)尚需时(shí)日，但(dàn)由(yóu)ControlNet引发的又一次AI绘画(huà)浪潮，让AIGC在ChatGPT的(de)话题热点包围中杀出重围。

ChatGPT之后又一(yī)应(yīng)用杀疯了，AIGC或进入可控期(qī)，将洗牌科技(jì)行业(yè)？_黑料(liào)正能量(liàng)

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可(kě)控靠(kào)近

以(yǐ)AI绘画为代(dài)表(biǎo)的AIGC上(shàng)一(yī)次爆火的时候，还是2022年8月(yuè)，在美国科罗拉多州举办的(de)新兴数字艺术家竞赛(sài)中，一幅名(míng)为《太空歌剧院》的作品(pǐn)获奖。

随后各大(dà)厂商的(de)AI绘画软(ruǎn)件被广大网友熟知并体验，Stable Diffusion便(biàn)是其中代表(biǎo)。

用户们可(kě)以(yǐ)在应用中输(shū)入一(yī)组关(guān)键词或(huò)者一张照(zhào)片，就能获得(dé)一幅AI创作的画作。

作画的(de)关键就是所输(shū)入(rù)的文本。同一组关键(jiàn)词也可以(yǐ)创(chuàng)作出很(hěn)多张风格不(bù)一样(yàng)的画作，这让创作的(de)过程就像开盲盒。

很多用(yòng)户很喜(xǐ)欢这种不确定的(de)惊喜，他(tā)们会将生成的(de)美(měi)图当做头像(xiàng)。而(ér)另(lìng)一部分喜欢翻看AI绘画(huà)的“翻车”作品。在社交(jiāo)媒体(tǐ)上，许多(duō)用户分享AI“翻车现场”，例如，一(yī)位(wèi)网友(yǒu)的小(xiǎo)狗照片被AI画成(chéng)了“肌肉(ròu)男”，还有网友的个人照片被AI识别成了建筑。

而如今随着(zhe)ControlNet的(de)出(chū)现与加(jiā)持，以(yǐ)往AI绘画的填(tián)写(xiě)关键词游戏可(kě)能要(yào)被(bèi)颠覆了。

ControlNet是一位正在斯坦福读(dú)博的中国人张(zhāng)吕(lǚ)敏(mǐn)创作的一种基(jī)于控(kòng)制点的图(tú)像(xiàng)变形(xíng)算法，主要(yào)用于数字(zì)图(tú)像(xiàng)处理、计算机(jī)视觉和计算(suàn)机(jī)图形学(xué)等领域。

其SD插件一(yī)经(jīng)发布(bù)，在短(duǎn)短的(de)两天内便成为(wèi)了AI绘(huì)画(huà)领域(yù)最新的(de)热点(diǎn)。

在此之前(qián)，大家用(yòng)了很(hěn)多(duō)方法想让AI生成(chéng)的结(jié)果尽可能(néng)的符合要求，但是(shì)都不(bù)尽如人意，它的出(chū)现代表着AI生成开始进(jìn)入真正(zhèng)的可控时期。

因为ControlNet可以直接提取画面的构图，人(rén)物的姿(zī)势(shì)和(hé)画(huà)面的深度信息(xī)等。有了它的帮助(zhù)，就不用频(pín)繁的(de)用提示词来碰运(yùn)气，抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相(xiāng)当于给AI绘画加了(le)“魔(mó)法”，不少博(bó)主的作(zuò)品已经获得了大量的(de)浏览量，“viggo”就是其中之一(yī)，他用朋友(yǒu)的照片直接(jiē)带她们走进动(dòng)漫世界(jiè)。

viggo先(xiān)用StableDiffusion图片转文字。

再用Text2Prompt插件(jiàn)拓展(zhǎn)找到(dào)对(duì)应的关键词(cí)；最后用ControlNet插(chā)件绑定骨(gǔ)骼(gé)开始换(huàn)关键(jiàn)词(cí)试效果。

通过图(tú)片就可以(yǐ)看出来，效(xiào)果(guǒ)十分惊艳。

更厉(lì)害(hài)的是，除了真实的照片，草图也可以加上“魔(mó)法”，知乎(hū)大牛“DevPoint”和“逗砂(shā)”介绍到ControlNet还(hái)能实现线稿转全彩(cǎi)图。大神张吕敏(mǐn)其(qí)本尊也亲自回(huí)应(yīng)。

不得不说当下AIGC已经变得越来越强大，甚至(zhì)输出(chū)的作品都已(yǐ)经能以假乱(luàn)真(zhēn)了。

难辨虚实(shí)，AIGC技术(shù)力(lì)爆发

警惕安全问(wèn)题

近日，“苏州(zhōu)金鸡湖有游艇party”的消(xiāo)息火遍网(wǎng)络，而经过警方辟谣(yáo)这所谓(wèi)的“party”可能是全国第一起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面(miàn)给出(chū)的美女照片都(dōu)是AI制作的真人照片绘图(tú)，因为太逼真，被大家当成真(zhēn)事传播了。

不过(guò)仔细(xì)观(guān)察可以发(fā)现，活动(dòng)发起者(zhě)提(tí)供(gōng)的照片中有个很(hěn)大的漏洞可以发现并非真人，而是AI绘图(tú)，那便是图片中女(nǚ)性的手指部(bù)分有的存在(zài)异常。

ChatGPT之后又一应用杀(shā)疯(fēng)了，AIGC或进入可(kě)控期，将洗牌科(kē)技行业？_黑料正能量

有行业人(rén)事表示：“现在因为手指部分的(de)绘画(huà)算法比较复杂，AI还不太会画人(rén)的手，但(dàn)最新看到的图(tú)片已经有(yǒu)越来(lái)越完美的AI模型出现，以后可能(néng)就完(wán)全没(méi)有漏洞了。”

类似的AI作图诈骗在国(guó)外也已有(yǒu)发生。据英国广(guǎng)播公司(sī)报道，土(tǔ)耳其(qí)地震期(qī)间，有Tiktok用户(hù)使用AI合成了(le)儿(ér)童受灾的(de)假照片(piàn)发布到网络(luò)，以此诱(yòu)骗(piàn)善良的(de)人(rén)打赏“捐助”从而实施诈骗(piàn)。

目(mù)前随着技(jì)术发展，AIGC已(yǐ)经能做出真人照片般的绘图效(xiào)果，如果这样的图片被用来诈骗，将(jiāng)非常可怕(pà)。

此外(wài)AIGC还(hái)引发(穿着高跟鞋的女奥特曼，穿红色高跟鞋的奥特曼fā)了很多担忧，一方面，批判(pàn)者认为AI在“学习(xí)”了大量(liàng)前人(rén)的作品(pǐn)之后，其创(chuàng)作(zuò)没有任何情绪和(hé)灵魂，难以(yǐ)和人类(lèi)的(de)艺术创作(zuò)相提并论(lùn)。

另(lìng)一方面，AIGC背(bèi)后的版权、目前都并没有得到有效的解(jiě)决(jué)，还(hái)有AIGC会不会代替(tì)人类“至高无上”的创意。

马斯(sī)克也强调，人工(gōng)智能的安全问题需要得到重视，太晚就来不及了。

AIGC下一站除了视(shì)频，还有(yǒu)远(yuǎn)方

技术都是有两面性的，潜(qián)在(zài)的危害(hài)并(bìng)不能掩(yǎn)盖其(qí)光(guāng)辉的贡献。现在看来，人(rén)工智能(néng)技术将是(shì)第四次工业革(gé)命的(de)核心驱动力量(liàng)，将创造新的(de)增长(zhǎng)奇迹。

过(guò)去一年(nián)，人工智能在技术和商(shāng)业(yè)层面都有了巨大进展，AI绘画(huà)就是人(rén)工智能技术发生方向性(xìng)改变的一个代表(biǎo)。其下一站或(huò)许(xǔ)就是视频(pín)。

此前，Meta和谷歌先后发布了几条(tiáo)引爆科技圈的短视频。这些视(shì)频引发(fā)关注并非内(nèi)容做得多优(yōu)秀，反而都非常简(jiǎn)单，比如一匹正在喝水(shuǐ)的马，一只(zhǐ)画画的玩具熊，或者一段(duàn)骑(qí)摩托(tuō)车(chē)的(de)第一视角录像(xiàng)，随便一个(gè)有手机的人(rén)都可以(yǐ)随手(shǒu)录(lù)下一段。

但这(zhè)些短(duǎn)视频的创作方式非常简单，创作(zuò)者仅仅需要向AI输入一段(duàn)话，甚(shèn)至只是说一下要求，AI就可以根据需要生(shēng)成一段视频。

谷歌发布(bù)的两个AI生(shēng)成(chéng)视频分别来自(zì)于Imagen Video和(hé)Phenaki，前者主要(yào)突出的是(shì)高清(qīng)，与Meta的Make-A-Video没有(yǒu)太多的差别(bié)。

在Make-A-Video公(gōng)布了(le)AI生成的视(shì)频后，AI圈就已经玩(wán)了一波梗(gěng)，一个能够做出更高清视频的AI还不足以(yǐ)在短(duǎn)时间内戳中(zhōng)兴奋点。

Phenaki更加令(lìng)人(rén)震惊的地(dì)方在(zài)于，它可以制作出超过2分钟的连贯的(de)也有确切内容的视频，这才(cái)是(shì)真(zhēn)正让(ràng)人们感到惊(jīng)喜的(de)地(dì)方。因为无论AI生成的视频(pín)多(duō)么(me)高清，也(yě)只能是(shì)为内容(róng)生产者提供一个灵(líng)感(gǎn)，一个(gè)素(sù)材，一个过场动画(huà)。

不(bù)过(guò)能(néng)够制作出有(yǒu)具(jù)体剧(jù)情内容(róng)的视频就(jiù)意味(wèi)着，一(yī)些视频创作(zuò)由AI代(dài)替人工完成已经初步有了(le)可(kě)能。

当下AI的发展速度(dù)已(yǐ)经超过大(dà)部分人的想象。内(nèi)容产(chǎn)业的本质(zhì)是(shì)供(gōng)给创(chuàng)造需(xū)求(qiú)，AIGC作(zuò)为全(quán)新的内容生(shēng)产方式，可以为内容产业带来更新的内容(róng)风格、更快(kuài)的生产(chǎn)速度(dù)，更低的生产成(chéng)本，这无(wú)疑会(huì)驱动内容产业的(de)大爆发。

除了AI绘图、视(shì)频，AIGC技术还能应(yīng)用于音乐、代码、机器人动(dòng)作(zuò)等多种(zhǒng)内(nèi)容形式的(de)生成。不难(nán)发(fā)现(xiàn)该项(xiàng)技术不(bù)仅在游(yóu)戏(xì)等行(xíng)业(yè)能得到有效应用，对于下一(yī)代互(hù)联网(wǎng)各种(zhǒng)元素(sù)的构建亦有关(guān)键意(yì)义。

从商业化的角度来看，文化娱乐、教育、传媒等诸(zhū)多领(lǐng)域(yù)，本身就对基于AI的(de)可(kě)视(shì)化(huà)内容有(yǒu)强烈需求。

因此，AI绘画(huà)及(jí)视频或不(bù)是结(jié)果，而只是(shì)AI进程中(zhōng)的一块重要拼图，有望在技术更新(xīn)的加持下(xià)实现更大的应用价值。

AI从理(lǐ)解(jiě)内容，走向了可以(yǐ)生成内容(róng)，甚至(zhì)能够(gòu)创造出独立(lì)价值和独立视角(jiǎo)的内容。AIGC的再次出圈，更(gèng)代表着(zhe)未(wèi)来穿着高跟鞋的女奥特曼，穿红色高跟鞋的奥特曼的先进生产力即将到来。

紧抓大模型(xíng)与算力，牢固AIGC底座(zuò)

从技术的(de)发展(zhǎn)也(yě)可(kě)以(yǐ)看(kàn)出，在语言(yán)大模型(xíng)、图(tú)像大(dà)模型之后，多模态大(dà)模型已(yǐ)经成为了新的趋势。

大模型被(bèi)誉为当前人(rén)工智能发展的智能底(dǐ)座，是全球竞争最(zuì)激烈的研究(jiū)方向之一，包括谷歌、亚马逊、百度、阿里、腾讯等(děng)众(zhòng)多头部企业都在竞相发力。

不过训(xùn)练大(dà)模型的确价(jià)格不菲，以(yǐ)国盛(shèng)证券发布(bù)的《ChatGPT需(xū)要多少(shǎo)算力》报告估算，GPT-3训练一次的成本(běn)约为(wèi)140万美元。而(ér)对(duì)于(yú)一些(xiē)更大的LLM(大型语言模(mó)型(xíng))，训(xùn)练成本则介于200万美元至1200万美元高价之间(jiān)。

以ChatGPT在2023年1月的独立访客(kè)平均数1300万计算，其(qí)对应芯片需求(qiú)为3万(wàn)多(duō)片英伟达A100 GPU，初(chū)始投入成本约为8亿美元，每日仅电费就在(zài)5万美元左右。

此外不论是ChatGPT还是AIGC，都离(lí)不开庞(páng)大算力支持(chí)。在(zài)关(guān)注各(gè)类大(dà)模型的发展同时(shí)，更应(yīng)该关注算(suàn)力网络的建设。

算(suàn)力网络正驱动AI产业(yè)发展进入(rù)史诗级加速(sù)进(jìn)程，让(ràng)AIGC及(jí)通用AI这一人工智能发展(zhǎn)的(de)终极目标离得更近(jìn)。

因为算力可以(yǐ)对突(tū)破性(xìng)技术创新提(tí)供大(dà)力(lì)的支持(chí)。这(zhè)方面(miàn)，多模态大模型是典型。作为面向未(wèi)来强人工智能(néng)、通(tōng)用人工智能的重要技术(shù)创新，多模(mó)态大模(mó)型已经在(zài)人(rén)工(gōng)智能领域(yù)提出了(le)很多年，业界(jiè)也有不少(shǎo)技术突破，但(dàn)是，多模态大模型(xíng)进一步(bù)往下(xià)走(zǒu)，算力需(xū)求呈几何式上升，一般的算力基础设施(shī)很快将(jiāng)难以胜任(rèn)。

从图像、文字、语音(yīn)单独一项的训(xùn)练(liàn)，到双模态、三模(mó)态的跃迁(qiān)，让人工智(zhì)能可(kě)以灵活应对不同(tóng)模态的转化(huà)、像人与世界交互(hù)一样自然，这方面(miàn)，由算力网(wǎng)络来驱动(dòng)将有明显优势。