发奋还是发愤读书啊，发奋还是发愤图强-绿茶通用站群

发奋还是发愤读书啊，发奋还是发愤图强 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机(jī)器(qì)人ChatGPT火爆(bào)以来，微软公司创始人比(bǐ)尔·盖茨已多次公开谈论人(rén)工智能话(huà)题(tí)。在最近(jìn)的一次采(cǎi)访中，他再次表示：“AI可能会让(ràng)科技行(xíng)业(yè)迎来一次剧烈的洗牌”。

这个结(jié)论是他(tā)在当地时间(jiān)2月20日(rì)接受《In Good Company》节目专(zhuān)访时(shí)提(tí)出的。

他预期，AI的发展(zhǎn)可能会威胁(xié)到(dào)谷歌的市占率，因为微软在AI方(fāng)面的行动相当迅速。而最终科技巨头将把AI整合成用户的“全能(néng)助(zhù)手”，包揽一切(qiè)应用，与人们进行沟通并提供建议(yì)，可以取(qǔ)代亚(yà)马逊(xùn)、Siri或Outlook等应(yīng)用。

大佬口中(zhōng)全能助手的到来可能尚需时日，但由(yóu)ControlNet引(yǐn)发的又一次(cì)AI绘画浪潮(cháo)，让AIGC在ChatGPT的话题热点(diǎn)包(bāo)围中杀出重围。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期(qī)，将洗(xǐ)牌(pái)科技行业？_黑料正能量

ControlNet颠覆AI绘画新玩(wán)法

AIGC向(xiàng)可(kě)控靠近

以AI绘画为代表的(de)AIGC上一次(cì)爆火的(de)时候，还是2022年(nián)8月，在美国科罗(luó)拉多州举办的新兴数字艺术家竞赛中，一幅名为《太空歌剧(jù)院》的作品(pǐn)获奖。

随后(hòu)各大厂(chǎng)商的AI绘画软件被广大网友(yǒu)熟知并体(tǐ)验，Stable Diffusion便是其中代表。

用户们可(kě)以在应用(yòng)中输入一组关键词或者一张照片，就能获得一(yī)幅AI创作的画(huà)作。

作画的关键(jiàn)就是所输(shū)入的文本。同一(yī)组关键词(cí)也可以创作出很多张风格(gé)不一样的画作，这让(ràng)创作(zuò)的(de)过程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这种不确定的惊喜，他们会将(jiāng)生成的美图(tú)当做头像(xiàng)。而另一部分(fēn)喜欢(huān)翻看AI绘(huì)画的“翻车”作品。在社交媒体上，许(xǔ)多用户分享AI“翻(fān)车(chē)现场”，例如(rú)，一位网(wǎng)友的(de)小(xiǎo)狗照片被AI画成(chéng)了“肌(jī)肉男”，还有网友的个人照片被AI识别成了建筑。

而如(rú)今随着ControlNet的出(chū)现与加持，以往AI绘画的填写(xiě)关(guān)键词游戏可能(néng)要被颠(diān)覆了。

ControlNe发奋还是发愤读书啊，发奋还是发愤图强t是一位正在斯坦(tǎn)福读博的(de)中国人张吕敏创作的一种基于控(kòng)制点的图像(xiàng)变(biàn)形算法(fǎ)，主要用于数字图(tú)像处理、计(jì)算(suàn)机(jī)视觉和计(jì)算机图形学(xué)等领域。

其SD插件一经(jīng)发布，在短短(duǎn)的两天内便成(chéng)为了AI绘画领(lǐng)域(yù)最新的热点。

在此之(zhī)前，大家用了很多方(fāng)法(fǎ)想让AI生成(chéng)的结(jié)果尽可能(néng)的符合(hé)要求，但是都不尽如(rú)人意，它(tā)的出现代表着(zhe)AI生成开始进入真正的可控时期。

因为(wèi)ControlNet可以(yǐ)直(zhí)接(jiē)提(tí)取(qǔ)画(huà)面的构图，人物的姿势和画(huà)面(miàn)的深度(dù)信息(xī)等。有了它(tā)的帮助，就(jiù)不(bù)用频繁(fán)的用提示(shì)词(cí)来碰运气，抽(chōu)盲盒式的创作了。

通俗的说ControlNet相(xiāng)当于给AI绘画加了“魔法”，不少博主的作品(pǐn)已(yǐ)经获(huò)得了(le)大量(liàng)的浏览量，“viggo”就是(shì)其中之一，他(tā)用朋友的照片直接带她(tā)们走进动漫世界。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找(zhǎo)到对应(yīng)的(de)关键词；最后(hòu)用ControlNet插(chā)件绑定骨骼开始(shǐ)换(huàn)关键词试效果。

通过图片就可以看(kàn)出来，效果十分惊艳(yàn)。

更厉(lì)害的是，除(chú)了真实的照片，草图也(yě)可(kě)以加上(shàng)“魔法”，知乎大牛(niú)“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线稿转全彩(cǎi)图。大(dà)神张(zhāng)吕敏其(qí)本尊也亲自(zì)回应。

不得不(bù)说(shuō)当下AIGC已经变得越来越强大，甚至(zhì)输(shū)出的(de)作品都已经能以假乱(luàn)真(zhēn)了。

难辨虚实(shí)，AIGC技术力爆(bào)发

警惕安全问题

近日(rì)，“苏州金鸡湖有游艇party”的消息火遍网(wǎng)络，而经过警方辟谣(yáo)这所谓(wèi)的(de)“party”可(kě)能是(shì)全国第一起AI绘图诈骗。

由于这(zhè)个活动里(lǐ)面给出(chū)的美(měi)女照片都是AI制作的真人照片(piàn)绘图，因为太逼真，被大(dà)家(jiā)当成真事传播了。

不(bù)过(guò)仔细观察可以发现，活(huó)动发(fā)起者(zhě)提(tí)供的照片中有个(gè)很大的漏洞可(kě)以发现(xiàn)并非真人，而是AI绘图，那便是图片(piàn)中女性(xìng)的(de)手指部分有(yǒu)的存(cún)在异常。

ChatGPT之后又(yòu)一应用(yòng)杀疯了，AIGC或进入可(kě)控期，将洗牌科技行业？_黑料正(zhèng)能量

有行业(yè)人(rén)事表示(shì)：“现在(zài)因为手指部分(fēn)的绘画算(suàn)法比较复(fù)杂，AI还(hái)不太会(huì)画人的手，但最新看到的图片已经有(yǒu)越来越完(wán)美的AI模型出现，以后(hòu)可(kě)能就完全没有漏洞了。”

类似的AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广播公司报(bào)道，土耳(ěr)其地震期间(jiān)，有Tiktok用(yòng)户使用AI合成了(le)儿童受(shòu)灾(zāi)的假(jiǎ)照片发布到网络(luò)，以此诱骗善良的(de)人打赏(shǎng)“捐助”从而(ér)实施诈骗(piàn)。

目前随着(zhe)技(jì)术发展(zhǎn)，AIGC已经能(néng)做出(chū)真人照(zhào)片般(bān)的绘图效果，如果这样的图片被用来诈骗，将非(fēi)常可怕。

此(cǐ)外AIGC还引发了很(hěn)多担忧，一方(fāng)面，批(pī)判者认为AI在“学习”了大量前人的(de)作品之后，其创作没有任(rèn)何情绪和(hé)灵魂，难以和人类的艺术创作相提并(bìng)论(lùn)。

另(lìng)一方面，AIGC背后的版权、目前都并(bìng)没(méi)有得到有效的解决，还有AIGC会(huì)不会代替人(rén)类(lèi)“至高无上”的(de)创意。

马斯克也(yě)强(qiáng)调，人(rén)工智能(néng)的安(ān)全问题(tí)需要得到(dào)重(zhòng)视(shì)，太晚就来不及了。

AIGC下一站除了视频，还有远方

技(jì)术都是有两面性的，潜在的危害并(bìng)不能掩(yǎn)盖其光(guāng)辉的贡献。现在(zài)看来，人工智能(néng)技(jì)术(shù)将是(shì)第四(sì)次工业革命的(de)核心(xīn)驱(qū)动力量，将创造新(xīn)的增长奇(qí)迹。

过去一年，人工(gōng)智能在技术(shù)和(hé)商业层面都有了巨大进展，AI绘画就是人工智能(néng)技术发生方向性(xìng)改变的一个代(dài)表。其(qí)下一站或许就是(shì)视频。

此前，Meta和谷歌先(xiān)后(hòu)发布了几条引爆科技圈的短(duǎn)视频(pín)。这些视(shì)频引发(fā)关注并非内容做(zuò)得多优秀，反而都非常简单，比如(rú)一(yī)匹正在喝水的(de)马，一只画画的(de)玩具熊，或者(zhě)一段骑摩(mó)托车的第一视角录像，随便(biàn)一(yī)个有手机的(de)人都可以随手录下一段。

但这(zhè)些短(duǎn)视频的创作方式(shì)非常简单，创作者仅仅需要向(xiàng)AI输入一(yī)段话(huà)，甚至只是说一下要求，AI就可(kě)以根(gēn)据需要生(shēng)成一(yī)段视频。

谷(gǔ)歌发(fā)布的两个AI生成视频分别来自(zì)于(yú)Imagen Video和Phenaki，前者主要突(tū)出的是高清，与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布(bù)了AI生成的视频(pín)后(hòu)，AI圈就已经玩(wán)了(le)一波梗，一个能够做出更高清视(shì)频的AI还不足以在短(duǎn)时间内戳中兴奋点。

Phenaki更加令(lìng)人震(zhèn)惊的(de)地方在于，它可(kě)以制作(zuò)出超过2分钟(zhōng)的连贯的(de)也有确切(qiè)内容(róng)的视频(pín)，这才(cái)是真正(zhèng)让人们(men)感到惊喜的(de)地方。因为无论(lùn)AI生成的视频多么高清，也只能是(shì)为内容生产者(zhě)提供一个(gè)灵感，一(yī)个素材(cái)，一个(gè)过(guò)场动画。

不过(guò)能够制作(zuò)出有(yǒu)具体(tǐ)剧(jù)情内(nèi)容的视(shì)频(pín)就意味着(zhe)，一些视(shì)频(pín)创作由AI代替人工完成已经初步有了可能。

当(dāng)下AI的(de)发展速(sù)度已经超过大部分人的想象。内容(róng)产业的本质是供给创(chuàng)造需求，AIGC作为(wèi)全新(xīn)的内容生产(chǎn)方式，可以为内容(róng)产业带来更新的内容(róng)风格(gé)、更快的生产速度，更低的生(shēng)产成本，这无疑(yí)会(huì)驱动内(nèi)容产业(yè)的大(dà)爆(bào)发。

除了AI绘图、视频，AIGC技(jì)术还能应用于音乐、代(dài)码、机器人动作等多种内(nèi)容(róng)形式的生成(chéng)。不(bù)难发现该项技术不仅(jǐn)在游(yóu)戏等行业能得到有(yǒu)效(xiào)应用，对于下一代互(hù)联(lián)网各种元素的(de)构建(jiàn)亦有(yǒu)关键意义。

从商(shāng)业化的角度来看，文化娱乐、教育、传媒等诸多(duō)领域，本身就对基于AI的(de)可视化内容有强(qiáng)烈(liè)需求(qiú)。

因(yīn)此，AI绘(huì)画及视频(pín)或不是(shì)结(jié)果，而只(zhǐ)是AI进程(chéng)中的一块(kuài)重要拼图(tú)，有望(wàng)在技术(shù)更新的加持下实(shí)现更大(dà)的应用(yòng)价值(zhí)。

AI从理解内容，走向了可(kě)以生成内容(róng)，甚至(zhì)能够创(chuàng)造出(chū)独立价值和独立视角的内(nèi)容。AIGC的再(zài)次出圈，更代表着未(wèi)来的先进(jìn)生产力(lì)即将到来(lái)。

紧抓(zhuā)大模型与算力，牢固AIGC底座

从技术的发展也可以看(kàn)出，在(zài)语(yǔ)言大模(mó)型、图(tú)像(xiàng)大模型之后，多模态(tài)大模型(xíng)已经(jīng)成为了新的趋势。

大(dà)模型被誉(yù)为当前人(rén)工智能发展的智能底座，是全球竞争最激烈(liè)的(de)研究方向之一，包括谷歌、亚(yà)马逊、百度、阿里、腾讯等众(zhòng)多头部企(qǐ)业都(dōu)在竞相发力。

不过(guò)训练(liàn)大模型的确价(jià)格不菲，以国盛证(zhèng)券(quàn)发(fā)布的《ChatGPT需要多少算力(lì)》报告估算，GPT-3训练一次的成本约为140万美(měi)元(yuán)。而对于一些更大的(de)LLM(大型(xíng)语言模型)，训练成本则介于200万美(měi)元至1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月(yuè)的独立访客平均数1300万计算(suàn)，其对应(yīng)芯片需求为3万(wàn)多片英伟达A100 GPU，初(chū)始投(tóu)入成本约为8亿美元，每(měi)日仅电费就在(zài)5万美元(yuán)左右(yòu)。

此外(wài)不论是ChatGPT还是AIGC，都离(lí)不(bù)开(kāi)庞大(dà)算力支持(chí)。在关注各类大模型的(de)发展同时，更(gèng)应(yīng)该(gāi)关注(zhù)算(suàn)力网(wǎng)络的建设。

算(suàn)力(lì)网(wǎng)络正(zhèng)驱(qū)动AI产业发(fā)展(zhǎn)进(jìn)入史诗级加速进程(chéng)，让AIGC及通(tōng)用AI这一人(rén)工智能(néng)发展的(de)终极目(mù)标离得更近(jìn)。

因为算力可以对突破性技术创新提供大(dà)力的支持。这方面，多(duō)模态大模型是典型。作(zuò)为面向未来(lái)强人工智能、通(tōng)用人工智能(néng)的(de)重要技(jì)术创新，多模态大模型已经在人工(gōng)智能(néng)领域提出了很多年，业界也有(yǒu)不(bù)少技术突(tū)破，但(dàn)是(shì)，多(duō)模态大模型(xíng)进一步往下走(zǒu)，算力需求呈几何式上升，一般的算力基(jī)础设(shè)施很(hěn)快(kuài)将难以(yǐ)胜任。

从图像、文字、语音单(dān)独一项的训练，到双(shuāng)模态、三模态的跃迁，让人工智(zhì)能可以灵活应(yīng)对不(bù)同模态的转化、像(xiàng)人与世界交(jiāo)互一样自然，这方面，由算力网络来驱动(dòng)将(jiāng)有明显优势(shì)。