绿茶通用站群绿茶通用站群

仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也翻译,仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也议论文

仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也翻译,仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也议论文 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器人ChatGPT火爆(bào)以来,微软(ruǎn)公司(sī)创(chuàng)始人比(bǐ)尔·盖茨已多次公开谈论人工(gōng)智能话(huà)题。在最近的一次(cì)采访(fǎng)中,他再次表示:“AI可能会让科技行业(yè)迎来一次剧烈的(de)洗牌(pái)”。

这个结论(lùn)是他在当地时间2月20日(rì)接受《In Good Company》节目专(zhuān)访时提出的。

他预期,AI的发展可能会威胁到谷歌的市占率(lǜ),因为微软在(zài)AI方面的行动(dòng)相当迅速。而最终(zhōng)科技巨头(tóu)将把AI整合成(chéng)用户的“全能(néng)助手(shǒu)”,包揽一(yī)切应用,与人们(men)进(jìn)行(xíng)沟通(tōng)并提供建(jiàn)议,可以取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可能(néng)尚需(xū)时日,但(dàn)由(yóu)ControlNet引发的又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的(de)话题热点包(bāo)围中杀出重(zhòng)围。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌科技行业(yè)?_黑料正能量

01

ControlNet颠覆AI绘(huì)画新玩法

AIGC向可控靠近(jìn)

以AI绘画(huà)为代表(biǎo)的AIGC上一(yī)次爆火的时候(hòu),还是2022年8月,在美国科(kē)罗拉多州举办的新兴数字艺术家竞(jìng)赛中,一(yī)幅名为《太空歌剧(jù)院》的作品获奖(jiǎng)。

随后各大(dà)厂商的(de)AI绘画(huà)软件被(bèi)广大网友熟知并体(tǐ)验(yàn),Stable Diffusion便是其(qí)中代表。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科(kē)技行(xíng)业?_黑(hēi)料正能(néng)量仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也翻译,仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也议论文-ratio="0.7261345852895149" data-s="300,640" data-type="jpeg" data-w="639">

用户们可以在应用中输入一(yī)组关键词或(huò)者一张照片,就能获得一幅AI创作的画作。

作画的关键就是所(suǒ)输入的文(wén)本。同一组关键词也可以(yǐ)创(chuàng)作出(chū)很(hěn)多张风格不一样的(de)画(huà)作(zuò),这(zhè)让创(chuàng)作(zuò)的过程就像开盲盒。

很多用户很喜欢这(zhè)种不确定的惊喜,他(tā)们会将生成的美图当做头像(xiàng)。而另一部分喜欢翻看AI绘画的(de)“翻车”作品。在社交媒体上(shàng),许多(duō)用(yòng)户(hù)分享AI“翻车现场”,例如,一(yī)位网友的(de)小狗照(zhào)片被AI画成(chéng)了(le)“肌肉男”,还有网(wǎng)友的个人照片被AI识别成了建筑。

而如今随着ControlNet的(de)出(chū)现与加持(chí),以往AI绘画的填写关键词游戏可能要被(bèi)颠覆了。

ChatGPT之(zhī)后又一应(yīng)用(yòng)杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行业?_黑料(liào)正能量(liàng)

ControlNet是一位正在(zài)斯坦福读博的中国人张吕敏创作的一种(zhǒng)基于控制点的图(tú)像变形算法,主(zhǔ)要用于数字图像(xiàng)处理(lǐ)、计算机视(shì)觉和计算机图形学等领域。

其SD插件一经发布,在短短的(de)两天(tiān)内便成为了AI绘画领域最新(xīn)的(de)热点。

在此之前,大家用(yòng)了很多方法(fǎ)想让(ràng)AI生(shēng)成的结果尽(jǐn)可(kě)能的符合要求,但(dàn)是(shì)都(dōu)不尽如(rú)人意,它的出现代表着(zhe)AI生成开始进入真正的可控时(shí)期。

因为ControlNet可以直接提取画面的构图,人(rén)物的姿势和画面的(de)深度信息等。有了它(tā)的(de)帮(bāng)助,就不用频繁的用提示词来碰运气(qì),抽(chōu)盲盒式的创(chuàng)作了。

通俗(sú)的说(shuō)ControlNet相当于(yú)给AI绘(huì)画(huà)加了“魔法”,不少博(bó)主的作(zuò)品已经获得了(le)大量的浏览量,“viggo”就是其中之一,他用朋友的照片直接带她们走进动漫世界(jiè)。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科(kē)技行业?_黑料正能(néng)量

viggo先用(yòng)StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插件拓展找到对(duì)应的关键词;最后(hòu)用(yòng)ControlNet插件绑定(dìng)骨骼开始换关键词(cí)试(shì)效果。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌科技行(xíng)业?_黑(hēi)料正能量(liàng)

通过图片(piàn)就(jiù)可以看出来(lái),效果(guǒ)十(shí)分惊艳(yàn)。

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进(jìn)入(rù)可控期(qī),将洗牌科技行业?_黑料正能量

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将洗牌科技行(xíng)业(yè)?_黑料正能量

更厉害的是,除了真实的照片,草图也可以加上(shàng)“魔法”,知乎大(dà)牛“DevPoint”和“逗(dòu)砂”介(jiè)绍到ControlNet还(hái)能实(shí)现(xiàn)线稿转全(quán)彩图。大神张(zhāng)吕(lǚ)敏其本尊(zūn)也亲自回(huí)应。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能(néng)量

不(bù)得不(bù)说当(dāng)下(xià)AIGC已(yǐ)经(jīng)变得越来越(yuè)强大,甚(shèn)至输(shū)出的(de)作品都已经(jīng)能以假乱真了。

02

难辨虚(xū)实,AIGC技术力爆发

警惕安全问题

近日,“苏(sū)州金鸡湖有(yǒu)游艇party”的消息火(huǒ)遍网络,而经(jīng)过警方辟谣这所谓的(de)“party”可能(néng)是(shì)全国第(dì)一(yī)起AI绘(huì)图诈骗。

由于这(zhè)个活动里面给(gěi)出的美(měi)女照片都是AI制作的真人照(zhào)片绘(huì)图,因为太逼真,被大家当成真事传播了

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

不过仔细(xì)观察可以发现,活动发(fā)起者(zhě)提供的照片(piàn)中有个(gè)很大的漏洞(dòng)可以发现并(bìng)非真人,而是(shì)AI绘(huì)图,那便是图片中女性(xìng)的手指部分有(yǒu)的存在(zài)异(yì)常。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

有行业(yè)人事(shì)表(biǎo)示(shì):“现在(zài)因为手(shǒu)指部分的绘画(huà)算(suàn)法比较复杂,AI还不太会画(huà)人的手(shǒu),但最新看到的(de)图(tú)片已经有越来越完美的AI模型出(chū)现,以(yǐ)后可(kě)能(néng)就完全(quán)没有漏洞(dòng)了。

类似的(de)AI作图(tú)诈骗在国外也已有发(fā)生。据(jù)英国广(guǎng)播(bō)公司报道,土耳(ěr)其地震(zhèn)期间,有Tiktok用户使用AI合成了儿(ér)童受灾的假(jiǎ)照片(piàn)发布到网络,以此(cǐ)诱(yòu)骗善良的人打(dǎ)赏“捐助”从而实施诈骗。

目前(qián)随(suí)着技术(shù)发展,AIGC已经能做出(chū)真人照(zhào)片(piàn)般(bān)的绘图效果,如果这样(yàng)的图片被用(yòng)来诈(zhà)骗,将非常可(kě)怕。

此(cǐ)外AIGC还引发了很多担忧(yōu),一方面,批(pī)判者(zhě)认为AI在(zài)“学习”了大量(liàng)前人(rén)的作品之后(hòu),其(qí)创(chuàng)作没(méi)有任何情绪和灵魂,难以和人(rén)类的艺(yì)术创作相提并论。

另一方面(miàn),AIGC背后的版权、目前(qián)都并没有得到有效的解决,还有(yǒu)AIGC会不会代替人(rén)类“至高无上”的创意。

马斯克也强调,人工(gōng)智(zhì)能的安全问题需要得到重视,太晚就(jiù)来不(bù)及了。

03

AIGC下一(yī)站除(chú)了视频,还有远方

技术都是有两面(miàn)性(xìng)的,潜在的危害并(bìng)不(bù)能(néng)掩盖(gài)其光辉的贡献。现在看来,人工智能技术将(jiāng)是(shì)第四次工业革命的核心(xīn)驱动力量,将创造新(xīn)的增长奇迹。

过去一年,人工智能在(zài)技术和商(shāng)业层面都有(yǒu)了巨大进展,AI绘画(huà)就是(shì)人工智能(néng)技术发生(shēng)方向(xiàng)性改变的一个代表。其下一站或许就(jiù)是视(shì)频。

此前,Meta和谷歌(gē)先后(hòu)发布了几(jǐ)条引(yǐn)爆科技圈(quān)的短(duǎn)视频(pín)。这些(xiē)视频引发关注(zhù)并(bìng)非内容(róng)做得多优秀,反而(ér)都非常简单,比如(rú)一匹正(zhèng)在(zài)喝水的(de)马,一只画(huà)画(huà)的玩(wán)具熊,或者一段骑摩托(tuō)车的第一(yī)视角录(lù)像,随便(biàn)一个有手(shǒu)机的人都可以随手录下一段。

ChatGPT之(zhī)后又一应用杀(shā)疯了(le),AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

但这(zhè)些(xiē)短视(shì)频的创作方式非常简单,创作(zuò)者仅(jǐn)仅需要(yào)向AI输入一段话,甚(shèn)至只是说一(yī)下要求,AI就可(kě)以(yǐ)根据需要(yào)生成一段视频。

谷歌发(fā)布的两(liǎng)个(gè)AI生成视频分别来自(zì)于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多(duō)的差(chà)别。

在Make-A-Video公布了AI生成的视频(pín)后,AI圈就(jiù)已经玩了一波梗(gěng),一个能(néng)够(gòu)做出更(gèng)高清视频的AI还不足以在短时间内(nèi)戳中兴奋点。

Phenaki更加(jiā)令人震(zhèn)惊的(de)地方在于,它可以制作出超过2分(fēn)钟的连贯的也有确切(qiè)内(nèi)容(róng)的视频,这才是(shì)真正让(ràng)人们(men)感到惊喜的(de)地方。因为无论AI生成的视频多么高清,也只能(néng)是为内容生产者提供一个灵(líng)感,一(yī)个素(sù)材,一个过场动画(huà)。

不过(guò)能够制(zhì)作出有具体剧情(qíng)内容的视(shì)频就意(yì)味着,一些视频创作由AI代(dài)替人(rén)工(gōng)完成已经初(chū)步(bù)有了可能(néng)。

当(dāng)下AI的发展速度已经超过大部(bù)分人(rén)的想象(xiàng)。内容产业的本质(zhì)是(shì)供给(gěi)创造(zào)需求,AIGC作为全(quán)新的(de)内(nèi)容生产方式,可以为(wèi)内容(róng)产业带来更新的内容风格、更(gèng)快的生产速度,更低的(de)生产(chǎn)成(chéng)本,这无(wú)疑会驱动内容产业(yè)的大(dà)爆发。

除了AI绘图、视频,AIGC技术(shù)还能应(yīng)用于(yú)音乐(lè)、代码、机器人动作(zuò)等多(duō)种内容形式(shì)的生成(chéng)。不难发现该项技(jì)术(shù)不仅在游戏等行业能(néng)得到有效应用,对于下一(yī)代互联网(wǎng)各种元素的(de)构建(jiàn)亦有关键意义。

从商业(yè)化的角度(dù)来(lái)看,文化(huà)娱乐、教育、传媒等诸多领域,本(běn)身就(jiù)对基于AI的(de)可视(shì)化内(nèi)容(róng)有(yǒu)强烈需求。

因此,AI绘画及视(shì)频或不是结果,而只(zhǐ)是AI进程中的一块(kuài)重要拼(pīn)图(tú),有望在技术更新的加持下实(shí)现更大的(de)应用价(jià)值(zhí)。

AI从(cóng)理解内(nèi)容,走向了可以(yǐ)生成内容,甚至能够创造出(chū)独立价值和(hé)独立视角的内容。AIGC的再(zài)次出圈,更(gèng)代(dài)表着未(wèi)来的先进生产力(lì)即(jí)将到来(lái)。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能(néng)量

04

紧抓大模(mó)型与算力,牢固AIGC底座

从技术的发展也可以看出,在语言大模型、图(tú)像大模(mó)型之后,多模(mó)态大(dà)模型已经成为了(le)新的趋势。

大(dà)模型被誉为(wèi)当(dāng)前人(rén)工智能发展(zhǎn)的智能(néng)底座(zuò),是全球竞争最激烈的研究方向之一,包括(kuò)谷歌(gē)、亚马(mǎ)逊、百度、阿(ā)里、腾讯等(děng)众(zhòng)多头(tóu)部企业(yè)都(dōu)在竞相发力。

不过训练大模型的确价格(gé)不菲(fēi),以国盛证券发布的《ChatGPT需要多少算(suàn)力》报告(gào)估算,GPT-3训练一(yī)次的成本约为140万美元。而对于一些更大的LLM(大型语言模型),训(xùn)练成本则介于200万美元至(zhì)1200万美元高价之间(jiān)。

以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片需(xū)求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日仅(jǐn)电费就在(zài)5万美元左右。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或(huò)进(jìn)入可控(kòng)期(qī),将洗牌科技行业?_黑料正能(néng)量

此(cǐ)外不论是(shì)ChatGPT还是AIGC,都离不开庞(páng)大算力支持(chí)。在(zài)关注各类大模型的发展(zhǎn)同时,更应该关(guān)注算力网络(luò)的建(jiàn)设。

算力网(wǎng)络(luò)正驱动AI产(chǎn)业发展进入史诗级加(jiā)速进程,让AIGC及通用AI这(zhè)一人工(gōng)智能发展的终极目标离得更(gèng)近(jìn)。

因为算力(lì)可以对突破性技术创新(xīn)提供大(dà)力的(de)支持。这(zhè)方面,多模态大模型是典型。作为面向未(wèi)来强(qiáng)人工智能、通用人工智能的重要技术创新,多模态大(dà)模型已(yǐ)经在人工(gōng)智能(néng)领域提出了很多年,业(yè)界也有不少技术突破,但是,多(duō)模态大模型进一步(bù)往下(xià)走,算力需求呈几何式上升,一般的算力基础设(shè)施很(hěn)快(kuài)将难以胜任。

从(cóng)图像(xiàng)、文(wén)字(zì)、语音(yīn)单(dān)独一项的训练,到双模态、三模(mó)态的(de)跃(yuè)迁,让人(rén)工智能可以灵活(huó)应(yīng)对(duì)不同模态的转化、像人与世界交互一样自然(rán),这方面,由算(suàn)力网络(luò)来驱动将有明显优(yōu)势。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量(liàng)

此外,还有(yǒu)很多需要(yào)爆发式(shì)增长的算力来支撑的(de)技术(shù)创新,将在(zài)人(rén)工智能算力网络(luò)支撑下快速推进(jìn)。

AIGC已经露出曙(shǔ)光,期(qī)待在大模型(xíng)和大(dà)算力的支持下AIGC能(néng)持续(xù)颠覆内容生产的方式,将创造的边际成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也翻译,仲尼适楚,出于林中,见佝偻者承蜩,犹掇之也议论文

评论

5+2=