绿茶通用站群绿茶通用站群

发奋还是发愤读书啊,发奋还是发愤图强

发奋还是发愤读书啊,发奋还是发愤图强 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器(qì)人ChatGPT火爆(bào)以来,微软公司创始人比(bǐ)尔·盖茨已多次公开谈论人(rén)工智能话(huà)题(tí)。在最近(jìn)的一次采(cǎi)访中,他再次表示:“AI可能会让(ràng)科技行(xíng)业(yè)迎来一次剧烈的洗牌”。

这个结(jié)论是他(tā)在当地时间(jiān)2月20日(rì)接受《In Good Company》节目专(zhuān)访时(shí)提(tí)出的。

他预期,AI的发展(zhǎn)可能会威胁(xié)到(dào)谷歌的市占率,因为微软在AI方(fāng)面的行动相当迅速。而最终科技巨头将把AI整合成用户的“全能(néng)助(zhù)手”,包揽一切(qiè)应用,与人们进行沟通并提供建议(yì),可以取(qǔ)代亚(yà)马逊(xùn)、Siri或Outlook等应(yīng)用。

大佬口中(zhōng)全能助手的到来可能尚需时日,但由(yóu)ControlNet引(yǐn)发的又一次(cì)AI绘画浪潮(cháo),让AIGC在ChatGPT的话题热点(diǎn)包(bāo)围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗(xǐ)牌(pái)科技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩(wán)法

AIGC向(xiàng)可(kě)控靠近

以AI绘画为代表的(de)AIGC上一次(cì)爆火的(de)时候,还是2022年(nián)8月,在美国科罗(luó)拉多州举办的新兴数字艺术家竞赛中,一幅名为《太空歌剧(jù)院》的作品(pǐn)获奖。

随后(hòu)各大厂(chǎng)商的AI绘画软件被广大网友(yǒu)熟知并体(tǐ)验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌科技(jì)行(xíng)业?_黑料正(zhèng)能量

用户们可(kě)以在应用(yòng)中输入一组关键词或者一张照片,就能获得一(yī)幅AI创作的画(huà)作。

作画的关键(jiàn)就是所输(shū)入的文本。同一(yī)组关键词(cí)也可以创作出很多张风格(gé)不一样的画作,这让(ràng)创作(zuò)的(de)过程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这种不确定的惊喜,他们会将(jiāng)生成的美图(tú)当做头像(xiàng)。而另一部分(fēn)喜欢(huān)翻看AI绘(huì)画的“翻车”作品。在社交媒体上,许(xǔ)多用户分享AI“翻(fān)车(chē)现场”,例如(rú),一位网(wǎng)友的(de)小(xiǎo)狗照片被AI画成(chéng)了“肌(jī)肉男”,还有网友的个人照片被AI识别成了建筑。

而如(rú)今随着ControlNet的出(chū)现与加持,以往AI绘画的填写(xiě)关(guān)键词游戏可能(néng)要被颠(diān)覆了。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

ControlNe发奋还是发愤读书啊,发奋还是发愤图强t是一位正在斯坦(tǎn)福读博的(de)中国人张吕敏创作的一种基于控(kòng)制点的图像(xiàng)变(biàn)形算法(fǎ),主要用于数字图(tú)像处理、计(jì)算(suàn)机(jī)视觉和计(jì)算机图形学(xué)等领域。

其SD插件一经(jīng)发布,在短短(duǎn)的两天内便成(chéng)为了AI绘画领(lǐng)域(yù)最新的热点。

在此之(zhī)前,大家用了很多方(fāng)法(fǎ)想让AI生成(chéng)的结(jié)果尽可能(néng)的符合(hé)要求,但是都不尽如(rú)人意,它(tā)的出现代表着(zhe)AI生成开始进入真正的可控时期。

因为(wèi)ControlNet可以(yǐ)直(zhí)接(jiē)提(tí)取(qǔ)画(huà)面的构图,人物的姿势和画(huà)面(miàn)的深度(dù)信息(xī)等。有了它(tā)的帮助,就(jiù)不(bù)用频繁(fán)的用提示(shì)词(cí)来碰运气,抽(chōu)盲盒式的创作了。

通俗的说ControlNet相(xiāng)当于给AI绘画加了“魔法”,不少博主的作品(pǐn)已(yǐ)经获(huò)得了(le)大量(liàng)的浏览量,“viggo”就是(shì)其中之一,他(tā)用朋友的照片直接带她(tā)们走进动漫世界。

ChatGPT之(zhī)后(hòu)又一应用(yòng)杀疯(fēng)了,AIGC或(huò)进入(rù)可控期(qī),将洗牌科技行业?_黑料正能(néng)量(liàng)

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找(zhǎo)到对应(yīng)的(de)关键词;最后(hòu)用ControlNet插(chā)件绑定骨骼开始(shǐ)换(huàn)关键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正(zhèng)能量

通过图片就可以看(kàn)出来,效果十分惊艳(yàn)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将(jiāng)洗牌科(kē)技行业(yè)?_黑料(liào)正能量

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能(néng)量(liàng)

更厉(lì)害的是,除(chú)了真实的照片,草图也(yě)可(kě)以加上(shàng)“魔法”,知乎大牛(niú)“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现线稿转全彩(cǎi)图。大(dà)神张(zhāng)吕敏其(qí)本尊也亲自(zì)回应。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科(kē)技行业?_黑料正能(néng)量

不得不(bù)说(shuō)当下AIGC已经变得越来越强大,甚至(zhì)输(shū)出的(de)作品都已经能以假乱(luàn)真(zhēn)了。

02

难辨虚实(shí),AIGC技术力爆(bào)发

警惕安全问题

近日(rì),“苏州金鸡湖有游艇party”的消息火遍网(wǎng)络,而经过警方辟谣(yáo)这所谓(wèi)的(de)“party”可(kě)能是(shì)全国第一起AI绘图诈骗。

由于这(zhè)个活动里(lǐ)面给出(chū)的美(měi)女照片都是AI制作的真人照片(piàn)绘图,因为太逼真,被大(dà)家(jiā)当成真事传播了

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业?_黑料正能(néng)量

不(bù)过(guò)仔细观察可以发现,活(huó)动发(fā)起者(zhě)提(tí)供的照片中有个(gè)很大的漏洞可(kě)以发现(xiàn)并非真人,而是AI绘图,那便是图片(piàn)中女性(xìng)的(de)手指部分有(yǒu)的存(cún)在异常。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正(zhèng)能量

有行业(yè)人(rén)事表示(shì):“现在(zài)因为手指部分(fēn)的绘画算(suàn)法比较复(fù)杂,AI还(hái)不太会(huì)画人的手,但最新看到的图片已经有(yǒu)越来越完(wán)美的AI模型出现,以后(hòu)可(kě)能就完全没有漏洞了。

类似的AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广播公司报(bào)道,土耳(ěr)其地震期间(jiān),有Tiktok用(yòng)户使用AI合成了(le)儿童受(shòu)灾(zāi)的假(jiǎ)照片发布到网络(luò),以此诱骗善良的(de)人打赏(shǎng)“捐助”从而(ér)实施诈骗(piàn)。

目前随着(zhe)技(jì)术发展(zhǎn),AIGC已经能(néng)做出(chū)真人照(zhào)片般(bān)的绘图效果,如果这样的图片被用来诈骗,将非(fēi)常可怕。

此(cǐ)外AIGC还引发了很(hěn)多担忧,一方(fāng)面,批(pī)判者认为AI在“学习”了大量前人的(de)作品之后,其创作没有任(rèn)何情绪和(hé)灵魂,难以和人类的艺术创作相提并(bìng)论(lùn)。

另(lìng)一方面,AIGC背后的版权、目前都并(bìng)没(méi)有得到有效的解决,还有AIGC会(huì)不会代替人(rén)类(lèi)“至高无上”的(de)创意。

马斯克也(yě)强(qiáng)调,人(rén)工智能(néng)的安(ān)全问题(tí)需要得到(dào)重(zhòng)视(shì),太晚就来不及了。

03

AIGC下一站除了视频,还有远方

技(jì)术都是有两面性的,潜在的危害并(bìng)不能掩(yǎn)盖其光(guāng)辉的贡献。现在(zài)看来,人工智能(néng)技(jì)术(shù)将是(shì)第四(sì)次工业革命的(de)核心(xīn)驱(qū)动力量,将创造新(xīn)的增长奇(qí)迹。

过去一年,人工(gōng)智能在技术(shù)和(hé)商业层面都有了巨大进展,AI绘画就是人工智能(néng)技术发生方向性(xìng)改变的一个代(dài)表。其(qí)下一站或许就是(shì)视频。

此前,Meta和谷歌先(xiān)后(hòu)发布了几条引爆科技圈的短(duǎn)视频(pín)。这些视(shì)频引发(fā)关注并非内容做(zuò)得多优秀,反而都非常简单,比如(rú)一(yī)匹正在喝水的(de)马,一只画画的(de)玩具熊,或者(zhě)一段骑摩(mó)托车的第一视角录像,随便(biàn)一(yī)个有手机的(de)人都可以随手录下一段。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技行(xíng)业?_黑(hēi)料(liào)正能(néng)量(liàng)

但这(zhè)些短(duǎn)视频的创作方式(shì)非常简单,创作者仅仅需要向(xiàng)AI输入一(yī)段话(huà),甚至只是说一下要求,AI就可(kě)以根(gēn)据需要生(shēng)成一(yī)段视频。

谷(gǔ)歌发(fā)布的两个AI生成视频分别来自(zì)于(yú)Imagen Video和Phenaki,前者主要突(tū)出的是高清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布(bù)了AI生成的视频(pín)后(hòu),AI圈就已经玩(wán)了(le)一波梗,一个能够做出更高清视(shì)频的AI还不足以在短(duǎn)时间内戳中兴奋点。

Phenaki更加令(lìng)人震(zhèn)惊的(de)地方在于,它可(kě)以制作(zuò)出超过2分钟(zhōng)的连贯的(de)也有确切(qiè)内容(róng)的视频(pín),这才(cái)是真正(zhèng)让人们(men)感到惊喜的(de)地方。因为无论(lùn)AI生成的视频多么高清,也只能是(shì)为内容生产者(zhě)提供一个(gè)灵感,一(yī)个素材(cái),一个(gè)过(guò)场动画。

不过(guò)能够制作(zuò)出有(yǒu)具体(tǐ)剧(jù)情内(nèi)容的视(shì)频(pín)就意味着(zhe),一些视(shì)频(pín)创作由AI代替人工完成已经初步有了可能。

当(dāng)下AI的(de)发展速(sù)度已经超过大部分人的想象。内容(róng)产业的本质是供给创(chuàng)造需求,AIGC作为(wèi)全新(xīn)的内容生产(chǎn)方式,可以为内容(róng)产业带来更新的内容(róng)风格(gé)、更快的生产速度,更低的生(shēng)产成本,这无疑(yí)会(huì)驱动内(nèi)容产业(yè)的大(dà)爆(bào)发。

除了AI绘图、视频,AIGC技(jì)术还能应用于音乐、代(dài)码、机器人动作等多种内(nèi)容(róng)形式的生成(chéng)。不(bù)难发现该项技术不仅(jǐn)在游(yóu)戏等行业能得到有(yǒu)效(xiào)应用,对于下一代互(hù)联(lián)网各种元素的(de)构建(jiàn)亦有(yǒu)关键意义。

从商(shāng)业化的角度来看,文化娱乐、教育、传媒等诸多(duō)领域,本身就对基于AI的(de)可视化内容有强(qiáng)烈(liè)需求(qiú)。

因(yīn)此,AI绘(huì)画及视频(pín)或不是(shì)结(jié)果,而只(zhǐ)是AI进程(chéng)中的一块(kuài)重要拼图(tú),有望(wàng)在技术(shù)更新的加持下实(shí)现更大(dà)的应用(yòng)价值(zhí)。

AI从理解内容,走向了可(kě)以生成内容(róng),甚至(zhì)能够创(chuàng)造出(chū)独立价值和独立视角的内(nèi)容。AIGC的再(zài)次出圈,更代表着未(wèi)来的先进(jìn)生产力(lì)即将到来(lái)。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能量(liàng)

04

紧抓(zhuā)大模型与算力,牢固AIGC底座

从技术的发展也可以看(kàn)出,在(zài)语(yǔ)言大模(mó)型、图(tú)像(xiàng)大模型之后,多模态(tài)大模型(xíng)已经(jīng)成为了新的趋势。

大(dà)模型被誉(yù)为当前人(rén)工智能发展的智能底座,是全球竞争最激烈(liè)的(de)研究方向之一,包括谷歌、亚(yà)马逊、百度、阿里、腾讯等众(zhòng)多头部企(qǐ)业都(dōu)在竞相发力。

不过(guò)训练(liàn)大模型的确价(jià)格不菲,以国盛证(zhèng)券(quàn)发(fā)布的《ChatGPT需要多少算力(lì)》报告估算,GPT-3训练一次的成本约为140万美(měi)元(yuán)。而对于一些更大的(de)LLM(大型(xíng)语言模型),训练成本则介于200万美(měi)元至1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月(yuè)的独立访客平均数1300万计算(suàn),其对应(yīng)芯片需求为3万(wàn)多片英伟达A100 GPU,初(chū)始投(tóu)入成本约为8亿美元,每(měi)日仅电费就在(zài)5万美元(yuán)左右(yòu)。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或(huò)进入可控期(qī),将洗牌科技行业?_黑料正能量

此外(wài)不论是ChatGPT还是AIGC,都离(lí)不(bù)开(kāi)庞大(dà)算力支持(chí)。在关注各类大模型的(de)发展同时,更(gèng)应(yīng)该(gāi)关注(zhù)算(suàn)力网(wǎng)络的建设。

算(suàn)力(lì)网(wǎng)络正(zhèng)驱(qū)动AI产业发(fā)展(zhǎn)进(jìn)入史诗级加速进程(chéng),让AIGC及通(tōng)用AI这一人(rén)工智能(néng)发展的(de)终极目(mù)标离得更近(jìn)。

因为算力可以对突破性技术创新提供大(dà)力的支持。这方面,多(duō)模态大模型是典型。作(zuò)为面向未来(lái)强人工智能、通(tōng)用人工智能(néng)的(de)重要技(jì)术创新,多模态大模型已经在人工(gōng)智能(néng)领域提出了很多年,业界也有(yǒu)不(bù)少技术突(tū)破,但(dàn)是(shì),多(duō)模态大模型(xíng)进一步往下走(zǒu),算力需求呈几何式上升,一般的算力基(jī)础设(shè)施很(hěn)快(kuài)将难以(yǐ)胜任。

从图像、文字、语音单(dān)独一项的训练,到双(shuāng)模态、三模态的跃迁,让人工智(zhì)能可以灵活应(yīng)对不(bù)同模态的转化、像(xiàng)人与世界交(jiāo)互一样自然,这方面,由算力网络来驱动(dòng)将(jiāng)有明显优势(shì)。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能量

此外,还有很(hěn)多(duō)需(xū)要(yào)爆发式(shì)增长的(de)算(suàn)力(lì)来(lái)支撑(chēng)的技术创新,将在人工智能算力网络支撑下(xià)快速推进。

AIGC已经露出曙光,期(qī)待在(zài)大模型和大算(suàn)力的支持下AIGC能(néng)持续颠覆内(nèi)容生产的方式(shì),将(jiāng)创造的边(biān)际成本降低,让万(wàn)众受益。

未经允许不得转载:绿茶通用站群 发奋还是发愤读书啊,发奋还是发愤图强

评论

5+2=