ჩაშლის DeepSeek ტრამპის ოქროს ხანას?
DeepSeek-ის ეფექტის მნიშვნელობაზე, მის მოსალოდნელ გავლენაზე გეოპოლიტიკაზე, ეკონომიკაზე და უფრო ფართოდ ხელოვნური ინტელექტის განვითარებაზე.
ტრამპის ინაუგურაციაზე მსოფლიოში ყველაზე მდიდარი პირები, ე.წ. "ტექ ოლიგარქები"—მასკი, ცუკერბერგი, ბეზოსი, სერგეი ბრინი, სუნდარ პიჩაი და ტიმ კუკი—გამოჩენილი სტუმრები იყვნენ. ამ ფიგურებს, რომლებიც კოლექტიურად აკონტროლებენ ისტორიაში ყველაზე მომგებიან და გავლენიან კომპანიებს, ერთი რამ აერთიანებთ: მათი კომპანიები მუშაობენ ხელოვნური ინტელექტზე.
უკვე მომდევნო დღეს, პრეზიდენტმა ტრამპმა წარადგინა "პროექტი სტარგეიტი"—500 მილიარდ დოლარიანი ინვესტიცია AI ინფრასტრუქტურაში. ეს ინიციატივა მიზნად ისახავს აშშ-ის ტექნოლოგიური და ეკონომიკური დომინაციის გამყარებას მომავალი ათწლეულებისთვის.
თუმცა, იმავე დღეს მოულოდნელად გამოჩენილი ჩინური კომპანია DeepSeek და მისი ღია კოდის1 (open source) მქონე AI მოდელი DeepSeek-R1 მთელი მსოფლიოსთვის შოკის მომგვრელი აღმოჩნდა. აქამდე ფართოდ იყო გავრცელებული მოსაზრება, რომ ჩინეთი ხელოვნური ინტელექტის განვითარებაში აშშ-ს ჩამორჩებოდა. თუმცა როგორც აღმოჩნდა ჩინელები არც ისე შორს არიან ამ რბოლაში. ზოგი კომენტატორი ამტკიცებს რომ ახალი ჩინური მოდელი საფრთხის ქვეშ აყენებს ტრამპის ჯერ არ დაწყებულ ამერიკულ ახალ ოქროს ხანას.
რამდენად მნიშვნელოვანი მოვლენაა ეს და რა შეიძლება იყოს მისი ფართო შედეგები? შევეცდები ამ კითხვებს ვუპასუხო.
როგორ მუშაობენ ხელოვნური ინტელექტის მოდელები და რა არის დიფსიქის სიახლე?
იმისათვის რომ გავიგოთ რა ეკონომიკური და გეოპოლიტიკური მნიშვნელობა აქვს დიფსიქს მნიშვნელოვანია ყურადღება მივაქციოთ ხელოვნური ინტელექტის (AI)-ს ტექნიკურ მხარეს. ვეცდები დეტალებში ღრმად ჩასვლის გარეშე მიმოვიხილო მნიშვნელოვანი ტექნიკური ასპექტები, რაც დაგვეხმარება გავიგოთ რა დევს სასწორზე.
დღევანდელი ხელოვნური ინტელექტის მოდელები დაფუძნებულია ნეირონული ქსელების არქიტექტურაზე. როგორც სახელი გეუბნებათ ეს არქტიტექტურა შთაგონებულია ადამიანის ტვინის ანატომიით. ხელოვნური ინტელექტი როგორც სამეცნიერო დისციპლინა დიდწილად ეყრდნობა კოგნიტურ მეცნიერებას რომელიც სწავლობს ადამიანს ტვინს და შემეცნებას. ამ პროცესების მოდელირების შედეგათ მივიღეთ კომპიუტერული მოდელები რომლებიც აირეკლავდნენ ადამიანურ კოგნიციას. გარკვეული ეტაპის შემდეგ ეს ცალკე კვლევით პროექტად იქცა რომელიც არა უბრალოდ ადამიანის აზროვნების მოდელირებას არამედ "ხელოვნური" ინტელექტის სისტემების შექმნას ცდილობს. თუმცა ჩვენი ტვინის ანატომია შეგვიძლია გამოვიყენოთ მეტაფორად იმის გასაგებად თუ როგორ მუშაობს თანამედროვე AI მოდელები.
თითოეულ ადამიანს უდიდესი მეხსიერება და ცოდნა აქვს, რომლის გამოყენებითაც აზროვნებს. თუმცა, განსხვავებით წიგნების, აუდიო და ვიდეო ჩანაწერებისგან, რომლებიც სიმბოლოთა კოლექციებია, ტვინში ასეთი კოლექცია არ გვხვდება. ტვინი მხოლოდ ნეირონებისა (~86 მილიარდი) და მათ შორის კავშირებისგან, სინაფსებისგან (დაახლოებით 100 ტრილიონი), შედგება. კოგნიტური მეცნიერები ნეირონს კომპიუტაციის ელემენტად განიხილავენ, რომელიც სინაფსებით ქმნის ძლიერ და ეფექტურ დისტრიბუციულ ქსელს. მნიშვნელოვანია, რომ ცოდნა და მეხსიერება არ არის კონკრეტულ ნეირონებში შენახული. არამედ მეხსიერება აქტიური პროცესია, რომელიც ნეირონული ქსელის სტრუქტურაში რეალიზდება და რომელიც მუდმივად იცვლება ჩვენი აზროვნებისა და გამოცდილებების კვალდაკვალ.
ხელოვნური ინტელექტის მოდელები დაახლოებით ასეთი ნეირონული ქსელია, თუმცა აქ თითოეული ნეირონი და მათ შორის კავშირი არა ბიოლოგიური ნეირონებით არამედ სილიკონის ჩიპზე გაშვებული ციფრული პროცესითაა მოდელირებული. თითოეული მოდელი, მაგალითად ჩეტჯიპიტი ერთ მომენტში გაყინული ნეირონული ქსელია რომელსაც გარკვეული ცოდნა, მეხსიერება და კოგნიციის უნარი აქვს. რაც უფრო მეტი სინაფსური კავშირია ნეირონებს შორის, უფრო მეტი სახის ცოდნა და მეხსიერება შეიძლება ქონდეს როგორც ტვინს ისე მოდელს. ხელოვნური ინტელექტის მოდელების კონტექსტში სინაფსურ კავშირებს ანალოგს პარამეტრებს (parameters) ან წონებს (weights) უწოდებენ. მაგალითისთვის ჯიპიტის 3.5-ს 175 მილიარდი პარამეტრი ჰქონდა.
ხელოვნური ნეირონული ქსელის შესაქმნელად სამი ძირითადი ელემენტია საჭირო: მოდელის არქიტექტურა, მონაცემები და კომპიუტერული სიმძლავრე. არქიტექტურა წარმოადგენს ალგორითმულ მოდელს, რომელიც განსაზღვრავს ქსელის სტრუქტურას—ფენებს, კავშირებს და იმ წესებს, რომლითაც ის ამუშავებს ინფორმაციას. ეს არის გეგმა, რომელიც განსაზღვრავს, როგორ უნდა გადაამუშაოს ქსელმა დიდი მოცულობის მონაცემები და როგორ უნდა მოიყვანოს საკუთარი პარამეტრები ოპტიმალურ კონფიგურაციაში, რათა შეძლოს პატერნების ამოცნობა და გენერირება. ამ პროცესს წვრთნა (training) ეწოდება: მოდელი სწავლობს წინასწარ შერჩეული და დამუშავებული მონაცემების გამოყენებით, მუდმივად არეგულირებს პარამეტრებს და აუმჯობესებს თავის უნარებს. თუმცა, ეს მოითხოვს დიდ გამოთვლით რესურსს და სპეციალიზებულ ჩიპებს, რომლებიც უმკლავდებიან ამ რთულ მათემატიკურ ოპერაციებს. როგორც კი მოდელის პარამეტრები საბოლოოდ დაფიქსირდება, ქსელი მზადაა გამოსაყენებლად—ის შეიძლება ჩაერთოს კომუნიკაციაში, დააგენერიროს ტექსტი, ამოიცნოს გამოსახულებები ან შეასრულოს სხვა ინტელექტუალური ამოცანები.
მასშტაბირების კანონონები (The Scaling Laws)
AI მკვლევრებმა აღმოაჩინეს, რომ ხელოვნური ინტელექტის მოდელები ჭკვიანდებიან, როდესაც ვზრდით სამ ელემენტს: მონაცემების რაოდენობას, მოდელის პარამეტრებს და გამოთვლით სიმძლავრეს (ჩიპები). რაც უფრო მასშტაბურია ეს ფაქტორები, მით უკეთესია მოდელის უნარები. უცნობია, სადამდე იმუშავებს მასშტაბირების კანონი, თუმცა ჯერჯერობით ყოველი ახალი მოდელი წინაზე ჭკვიანია.
მასშტაბის გაზრდას ორი რამ აფერხებს: საწვრთნელი მონაცემები მალე ამოგვეწურება და უფრო დიდი მოდელებისთვის საკმარისი ჩიპები და ენერგია აღარ გვექნება.
დღეს არსებული მოდელები ინტერნეტში არსებულ თითქმის ყველა ინფორმაციაზე იწვრთნება, თუმცა ეს მონაცემები მაინც სასრულია. გარდა ამისა, მონაცემთა ცენტრების ზრდა დიდ ფინანსებსა და რესურსებს მოითხოვს. ჩიპებისა და ენერგიის წარმოება კი ამ პროცესის მთავარი შემაფერხებელია.
დიფსიქის სენსაციის არსის გასაგებად საჭიროა 2024 წლის კიდევ ერთი მნიშვნელოვანი ტექნიკური ინოვაციის განხილვა. კვლავ ადამიანის და ხელოვნური ინტელექტის ანალოგიას მივყვეთ.
წვრთნის შემდეგ მოდელს პასუხის გასაცემად კომპუტაციური რესურსი სჭირდება. ამ პროცესში ის საკუთარ პარამეტრებს ეყრდნობა და დასკვნას (inference) აკეთებს. ამჟამინდელი LLM-ების ერთ-ერთი მთავარი პრობლემა დასკვნის ეტაპზე ჰალუცინაციებია, ან უფრო ზუსტად, კონფაბულაციები (ტექსტუალური ჰალუცინაცია)—როდესაც მოდელი არაფაქტობრივ პასუხებს ისე გვაწვდის, თითქოს ეს დადასტურებული ცოდნა იყოს.
ადამიანებიც მსგავსად ვიქცევით: როცა ვინმეს ვასიამოვნებთ, თავს ვიმართლებთ ან რაღაცის დამტკიცება გვინდა, შესაძლოა, დარწმუნებით ვილაპარაკოთ საკითხზე, რომლის საფუძველსაც თავად ვერ ავხსნით.
LLM-ების შემთხვევაში, როდესაც ისინი არასწორ პასუხს გვიბრუნებდნენ, შეგვეძლო მიგვენიშნებინა მათი სისუსტე და სხვა ფორმულირებით გვეცადა პასუხის მიღება. ამის შედეგად, მოდელი თავიდან უშვებდა დასკვნის პროცესს და ხშირად უფრო ზუსტ და საინტერესო პასუხს გვაძლევდა.
თუმცა, მრავალი მცდელობის მიუხედავად, ჰალუცინაციების პრობლემა ვერ მოგვარდა – ვერც უკეთესი მონაცემებით, ვერც უფრო დიდი მოდელებით. შემდეგ შექმნეს ახალი მეთოდი: Chain of Thought Reasoning. მოდით, ამას აზროვნება დავუძახოთ.
რა არის აზროვნება? როგორც ნეირონული ქსელები, ადამიანები დასკვნის დროს ხშირად ვუშვებთ შეცდომებს და კონფაბულაციას მივმართავთ. თუმცა, თუ ადამიანს ვთხოვთ, არ იჩქაროს, დაფიქრდეს, გამოიყენოს კალამი და ფურცელი და ნაბიჯ-ნაბიჯ გააანალიზოს პრობლემა, მისი პასუხი უფრო ზუსტი იქნება.
ამავე პრინციპით, ხელოვნურ ინტელექტშიც დაიწყეს ამ მიდგომის გამოყენება. აზროვნების პროცესში, სანამ მოდელი საბოლოო პასუხს მოგვცემს, ის ეტაპობრივად აანალიზებს საკითხს, აგენერირებს მსჯელობას და მხოლოდ ამის შემდეგ გვპასუხობს. ამ ინოვაციამ მნიშვნელოვნად შეამცირა კონფაბულაცია და მოდელებს უფრო საინტერესო, ლოგიკური და რთული პრობლემების გადაჭრის უნარი მისცა.
აქედან გამომდინარეობს მასშტაბირების კანონი 2.0: რაც უფრო მეტ კომპიუტაციულ რესურსს დავხარჯავთ აზროვნების პროცესზე (და არა მხოლოდ წვრთნაზე), მით უფრო ჭკვიანი გახდება მოდელი. ეს ნიშნავს, რომ მონაცემების ამოწურვაც აღარ არის შეზღუდვა—თუ საკმარის ენერგიას და კომპიუტაციულ რესურსს გამოვიყენებთ, მოდელების შესაძლებლობებიც გაიზრდება.
ამ სფეროში OpenAI ლიდერია. მათი ყველაზე ძლიერი მოდელი, „O3“, უკვე წყვეტს მათემატიკურ ამოცანებს, რომელთა გადაწყვეტა აქამდე შეუძლებლად მიიჩნეოდა, თუმცა ამ მოდელით ერთი პასუხის გამოთვლაც კი საკმაოდ დიდ ხარჯებთან არის დაკავშირებული. O3 ჯერ არ არის ხელმისაწვდომი, ხოლო O1 მოდელს 200 დოლარიან პაკეტში შედის, თუმცა მისი აზროვნების პროცესი დაფარულია და უცნობია ტექნოლოგია რომელიც მას უდევს საფუძვლად. სწორედ აქ იჩენს თავს DeepSeek-ის მნიშვნელობა.
DeepSeek-ის ტექნიკური ინოვაციები
მიუხედავად იმისა, რომ ტექნოლოგიური მიღწევების თეორიული საფუძვლები ცნობილია და მრავალი სამეცნიერო გარღვევა საჯაროდ ქვეყნდება, მოწინავე ტექნოლოგიები დიდი ამერიკული კორპორაციების კომერციულ საიდუმლოდ რჩება. მეტას (ფეისბუქის) გარდა, ყველა მოწინავე მოდელი დახურულია. გავრცელებული მოსაზრებით, ამერიკა ლიდერი იყო, ხოლო ჩინეთი მინიმუმ წლით ჩამორჩებოდა. თუმცა დიფსიქმა დამოუკიდებლად გადაჭრა იგივე ტექნოლოგიური სირთულეები და დაამატა ალგორითმული ინოვაციები, რამაც მისი მოდელი ამერიკული მოწინავე მოდელების მსგავსად ჭკვიანი თუმცა უფრო ხარჯ-ეფექტური გახადა. თანაც მათ ეს შეძლეს მაშინ, როცა ჩინეთი ბოლო თაობის ჩიპების ემბარგოს ქვეშ იმყოფებოდა. ნაწილობრივ, სწორედ ამ შეზღუდვამ უბიძგა მათ ალგორითმული ინოვაციების შექმნისკენ.
დიფსიქმა აჩვენა ორი რამ. ერთი რომ ჩინურ AI ლაბორატორიებს შეუძლიათ ბოლო თაობის ამერიკული ჩიპების გარეშეც იგივე დონის მოდელების შექმნა. და მეორე რომ ჩინეთი აღარ არის მხოლოდ კოპირების ეტაპზე, არამედ მათგან უკვე ნამდვილ ინოვაციებსაც უნდა ველოდოთ.
დიფსიქის ეს მოდელი, DeepSeek V3, ჯერ კიდევ 26 დეკემბერს გამოვიდა. თუმცა რეაქცია რომელსაც დღეს ვხედავთ დაგვიანებით, მხოლოდ მას შემდეგ გამოჩნდა როდესაც მათ კიდევ ერთი მოდელი ახლა უკვე მოაზროვნე DeepSeek R1 გამოუშვეს 2025 წლის 20 იანვარს ტრამპის ინაუგურაციის დღეს. სწორედ მოაზროვნე მოდელმა გამოიწვია შოკი როგორც საფონდო ბირჟაზე ისე პუბლიკაში მთელი მსოფლიოს გარშემო.
ტექნიკური მიღწევები სინამდვილეში დეკემბერში გამოშვებულ DeepSeek V3-ში უკვე იყო წარმოდგენილი. მაშინ რატომ ასეთი დაგვიანებული რეაქცია? მე ვვარაუდობ რომ სხვა ბევრ ფაქტორთან ერთად დიდი როლი ითამაშა სწორედ მოაზროვნე მოდელმა. თუ აქამდე მოაზროვნე მოდელი მხოლოდ ფასიან ჩატჯიპიტის ვერსიაში იყო ხელმისაწვდომი დიფსიქმა ის უფასოდ ხელმისაწვდომი გახადა ყველასთვის. კიდევ ერთი ერთი შეხედვით მცირე დეტალი, რომელაც ჩემი აზრით ნაკლები ყურადღება ექცევა დიფსიქის გადაწყვეტილება იყო რომ ეჩვენებინათ აზროვნების პროცესი. Open AI ამ პროცესს მალავდა კომერციული საიდუმლოების დაცვის მიზნით. მოდელის აზროვნების პროცესის წაკითხვა კიდევ უფრო "ადამიანურს" ხდის მოდელს და დამატებითი აღტაცების წყაროც გახდა. ჩემი აზრით მომხარებლის ინტერფეისში ამ პროცესის ჩვენებით დიფსიქმა უამრავი ადამიანისთვის ინტუიციური გახადა ის პროგრესი რასაც ხელოვნური ინტელექტის სფერო განიცდის და ააჩქარა ის რეაქცია რასაც დღეს ყველა ვხედავთ.
შემდეგი რევოლუციური ნაბიჯი ის იყო რომ დიფსიქმა ეს ახალი მოდელები open source-ად გამოაქვეყნა და ფაქტობრივად აჩუქა კაცობრიობას. თუ აქამდე მსოფლიოს დახურულ მოდელებს მიღმა არჩევნი არ გვქონდა და ფაქტობრივად გვიწევდა ტექ კომპანიებისთვის რენტის გადახდა, ახლა გვაქვს ღია კოდი რომელიც გაცილებით იაფად შეუძლია გაუშვას ნებისმიერმა კომპანიამ, უნივერსიტეტმა თუ ინდივიდმა ლოკალურად საკუთარ სერვერზე.
ხელოვნური ინტელექტის ეკონომიკა
სანამ დიფსიქის ეკონომიკურ და გეოპოლიტიკურ შედეგებზე გადავალთ, მოკლედ მიმოვიხილოთ ხელოვნური ინტელექტის ეკონომიკური კონტექსტი. ეს ჯერ კიდევ ჩანასახში მყოფი ინდუსტრიაა და ტექნოლოგიების ეკონომიკის მიერ ათვისებას გარკვეული დრო სჭირდება. თუმცა ხელოვნური ინტელექტმა უკვე მოხსნა რეკორდები. მაგალითად ჩატჯიპიტის აპლიკაციამ გამოსვლიდან, მხოლოდ 5 დღეში მიაღწია 1 მილიონ მომხმარებელს და შემდგომში მალევე 100 მილიონს. ამით ჩატჯიპიტი ისტორიაში ყველაზე სწრაფად მზარდი სამომხარებლო აპლიკაცია გახდა.
ამ შთამბეჭდავი ციფრების მიუხედავად შეიძლება ვთქვათ რომ AI კვლავ R&D (კვლევის და განვითარების) ფაზაშია. კაპიტალი რომელიც ტექნოლოგიური კომპანიებისკენ მიედინება ძირითადად გამოიყენება არა ხელოვნური ინტელექტის სერვისებში არამედ ახალი, უფრო დიდი და ჭკვიანი მოდელების გაწვრთნაში. რაც როგროც ზემოთ ვახსენეთ მასშტაბირების კანონების ლოგიკას მიჰყვება. ეს კი ნიშნავს მეტ ინვესტიციებს ჩიპებში და ენერგიაში. შესაბამისად გასაკვირი არაა რომ დღესდღეობით ყველაზე მეტად მოგებული AI-ის ამ ბუმისგან ჩიპების მწარმოებელი Nvidia დარჩა.
Nvidia ქმნის გრაფიკის დამუშავების ერთეულებს (GPU) ანუ გრაფიკულ პროცესორებს/ჩიპებს რომლებიც საუკეთესოა AI მოდელების გასაწვრთნელად. ჩატჯიპიტის გაშვებიდან მალევე Nvidia-ს ღირებულებამ მკვეთრი ზრდა დაიწყო და დღეს მისი კაპიტალიზაცია აჭარბებს 3 ტრილიონ ამერიკულ დოლარს და ეფლის შემდეგ მეორე ყველაზე ძვირადღირებული კომპანიაა.
ის რომ Nvidia და არა სხვა რომელიმე კომპანია რომელიც უშუალოდ ქმნის ხელოვნურ ინტელექტს მიანიშნებს იმაზე რომ ხელოვნური ინტელექტის კომოდიფიკაცია ჯერ არ მომხდარა. თუმცა ბაზრის მოლოდინია რომ ეს მოხდება, რაც საჭიროება გააჩენს კიდევ უფრო მეტი ჩიპისა, რომელზეც გაეშვება ეს მოდელები.
ჩიპების ეს ცენტრალური როლი აისახა გეოპოლიტიკურ კონტექსტშიც და ამერიკამ ჩინეთს ბოლო თაობის ჩიპების ემბარგო დაუწესა. მოტივაცია მდგომარეობს იმაში რომ ჩინურმა კომპანიებმა ვერ ისარგებლონ მასშტაბირების კანონით და ვერ შექმნან ამერიკულზე უპირატესი მოდელები.
გარდა ამისა კიდევ ერთი ბოთელნექი რომელიც მასშტაბირების კანონიდან გამომდინარეობს არის ენერგია. ტექნოლოგიურმა გიგანტებმა აქტიურად დაიწყეს ამ მიმართულებით ტრამპის ადმინისტრაციაში ლობირება. მათ შორის აქტიურად ჩაერთვნენ ბირთვული ენერგიის გაცოცხლებაში. ტრამპის მიერ "ეროვნული საგანგებო ენერგეტიკული მდგომარეობის" გამოცხადება ამ კონტექსტშიც შეგვიძლია წავიკითხოთ.
მაგრამ ეს მხოლოდ პრელუდიაა. ამხელა კაპიტალის და რესურსების ხარჯვის შედეგი არ იქნება უბრალოდ უფრო ჭკვიანი ჩატბოტი, რომელსაც ჩატის ინტერფეისში დაველაპარაკებით. მას შემდეგ რაც მოდელები უფრო სანდო, სწრაფი, და იაფი გახდება უნდა ველოდოთ მათ დანერგვას ეკონომიკის ყველა სფეროში. თვითმავალი მანქანები, მედიცინა, მეცნიერება, განათლება, მომხმარებელთა მომსახურება, პროგრამული უზრუნველყოფა, რობოტიკა და ა.შ.
AI დიდი ალბათოვით იქნება მომავალი ათწლეულების განმავლობაში ეკონომიკური ზრდის მთავარი წყარო. ის ვინც პირველი შექმნის ამ მოდელებს, და ინფრასტრუქტურას რომელზეც ისინი გაეშვება იქნება მთავარი ბენეფიციარი ამ ეკონომიკური ზრდის. ტრამპის დაანონსებული ოქროს ხანა გარკვეულწილად სწორედ ამ მოლოდინებზე დგას.
დიფსიქის ეკონომიკური და გეოპოლიტიკური შედეგები
დავუბრუნდეთ დიფსიქს. რა ეკონომიკური და გეოპოლიტიკური შედეგები მოჰყვება დიფსიქის ღია კოდის მოდელების ფართო გავრცელებას? ერთი შეხედვით შეიძლება მსგავსი მსჯელობა განვავითაროთ. ამერიკულმა კომპანიებმა მილიარდები დახარჯეს მონაცემთა ცენტრების აშენებაში და მოდელების გაწვრთნაში. მათი გათვლა იყო რომ მომავალი მოგება რომელიც ამ მოდელების სერვისად გაყიდვით მიიღწეოდა ამართლებდა ამ დანახარჯებს. თუმცა ახლა დიფსიქის ახალი მოდელები, რომლებიც ყველას შეუძლია გამოიყენოს და რომელთა ხარჯიც გაცილებით ნაკლებია, ამერიკული კომპანიების მომავალი მოგების მოლოდინს ეჭვქვეშ აყენებს. შესაბამისად მათი მთელი ბიზნეს მოდელი კითხვის ნიშნის ქვეშ დგება და შესაძლოა ველოდოთ ბუშტის გახეთქვას.
ასევე Nvidia-სთან დაკავშირებით რომელმაც 650$ მილიარდი დოლარი დაკარგა საბაზრო კაპიტალიზაციაში. Nvidia-ს ჩიპებზე ეშვება უმეტესი მოდელის წვრთნის და დასკვნის ფაზაც. ერთი შეხედვით მოლოდნია რომ მომავალი მოდელების გასაშვებად აღარ იქნება საჭირო ასეთი ძლიერი და ამ რაოდენობის ჩიპები.
რამდენად გამართლებულია ეს დაშვებები და მართლა ასე ცუდად არის საქმე ამერიკისთვის? მოდით ვნახოთ კონტრარგუმენტები.
პირველ რიგში, დიფსიქის შთამბეჭდავი მიღწევების მიუხედავად ამერიკული კომპანიები ფლობენ უკეთეს მოდელებს. ზოგიერთი მოდელი უკვე ხელმისაწვდომია ბაზარზე, ზოგიერთ კი მალე გახდება ხელმისაწვდომი. ინვესტიციები და დანახარჯები რომელსაც ეს ამერიკული კომპანიები ეწევიან უნდა გავიგოთ როგორც ინვესტიცია R&D-ში. მათი მოლოდინია რომ პირველებმა შექმნან AGI, ზოგადი ხელოვნური ინტელექტი, რომელიც ადამიანის ინტელექტს აჯობებს ყველა სფეროში. შესაბამისად მათი გათვლა და არც ბაზრის მოლოდინი არ ყოფილა არასდროს რომ ისინი ამ მოდელების მოგებით რომელსაც დღეს წვრთნიან მიიღებდნენ საჭირო მოგებას (თუმცა ეს მოგებაც არ არის მცირე).
მეორე ასპექტი. Microsoft-ის აღმასრუელბელმა დირექტორმა სატია ნადელამ დატვიტა ჯევონის პარადოქსის შესახებ, რაც გულისხმობს რომ რაც უფრო გაიაფდება და ხელმისაწვდომი გახდება AI მოდელები, ეს უფრო გაზრდის მისი კომოდიფიცკაციას, უფრო მეტი ადამიანი, ბიზნესი და ინსტიტუტი გამოიყენებს მას. შესაბამისად ინვესტიციები ამ მიმართულებით კიდევ უფრო გაიზრდება და არა პირიქით. იქნება მეტი დატა ცენტრი, მეტი ჩიპი, მეტი ენერგია და მეტი ალგორითმული ინოვაცია და არა ნაკლები.
გარდა ამისა, როგორც ზემოთ ვახსენეთ ჩვენ ვიმყოფებით "მასშტაბირების კანონი 2.0.-ის" ეტაპზე. რაც ნიშნავს რომ ახალი მონაცემთა ცენტრები იქნება გამოყენებული არა მხოლოდ მოდელის გასაწვრთნელად, არამედ საფიქრელად. 500$ მილიარდ დოლარიანი მონაცემთა ცენტრი, Stargate, რომელიც ტრამპმა თავის ინაუგურაციის მეორე დღეს დაანონსა OpenAI-ს სჭირდება იმისათვის რომ მისმა მოდელებმა იფიქრონ. თუ ინოვაცია ამ ფიქრს უფრო გააიფაებს, ისინი უბრალოდ კიდევ უფრო მეტს იფიქრებენ.
და მაინც რატომ ამხელა აჟიოტაჟი თუ არაფერი არ ემუქრება ამერიკულ კომპანიებს?
ხელოვნური ინტელექტი როგორც ამერიკის უნიპოლარული დომინაციის ინსტრუმენტი
დარიო ამოდეიმ, Antrophic-ის (claude.ai, ერთ-ერთი მთავარი ამერიკული AI კომპანია) აღმასრულებელმა დირექტორმა, გამოაქვეყნა ესე დიფსიქის შესახებ. მისი პოზიცია ირეკლავს როგორც სილიკონ ველის ბიზნეს ელიტის, ასევე ბაიდენისა და ტრამპის ადმინისტრაციის ხედვებს.
მისი აზრით მიუხედავად დიფსიქის ინოვაციებისა ეს მაინც არ არის განსკუთრებული ამბავი და ეჭვობს რომ ისინი არ აღიარებენ Nvidia-ს ჩიპების ქონას, რომელიც ექპორტის აკრძალვის გამო წესით არ უნდა ჰქონოდათ. თუმცა ამ დაშვებით ის გულისხმობს რომ ჩიპების არსებობის შემთხვევაში ჩინურ ლაბორატორიებს აქვთ შესაძლებლობა დაეწიონ ამერიკულ ლაბორატორეიბს. შესაბამისად ის ჩიპების ექსპორტის კონტროლის იდეით გამოდის. რომელიც მისი აზრით ერთადერთი გზაა რომ შეაჩერონ ჩინური AI.
მისი აზრით კაცობრიობის განვითარება ორი გზით შეიძლება მოხდეს იქიდან გამომდინარე შეძლებს თუ არა ჩინეთი ჩიპების მოპოვებას. პირველ შემთხვევაში თუ ჩინეთი ამას ვერ შეძლებს ამერიკა დაასწრებს ჩინეთს AGI-ს შექმნას და ეს ტექნოლოგია და მისით მიღწეული ეკონომიკური დომინაცია შექმნის უნიპოლარულ სამყაროს სადაც ამერიკა და მისი მოკავშირეები ("თავისუფალი სამყარო") ისარგებლებენ მნიშვნელოვანი უპირატესობით და გლობალურ სცენაზე შეინარჩუნებენ პოზიციებს.
ხოლო მეორე შემთხვევაში, თუკი ჩინეთი მოახერხებს ჩიპების მიღებას და ისიც შექმნის AGI-ს, მაშინ მივიღებთ ბიპოლარულ სამყაროს. თუმცა ამოდეი პროგნოზირებს რომ ეს თანასწორობა მალევე გადაიხრება ჩინეთის სასარგებლოდ. რადგან ჩინეთს მეტი ადამიანური რესურსი, დიდი ინფრასტრუქტურა, და სამხედრო-ინდუსტრიული ბაზა აქვს.
შესაბამისად დიფსიქის ეფექტი იმის გააზრებაში მდგომაროებს რომ მასშტაბირების კანონის ბენეფიციარი შეიძლება ჩინეთი და არა ამერიკა აღმოჩნდეს. და ყველა ის სარგებელი რაც პირველად AGI-ს შექმნას შეიძლება მოჰყვეს, ჩინეთს შეხვდება.
ოპტიმისტური ხედვა: ღია კოდი დახურული კოდის წინააღმდეგ და ხელოვნური ინტელქტის დემოკრატიზაცია
არსებობს კიდევ ერთი პერსპექტივა, გარდა გეოპოლიტიკური, სუპერ სახელმწიფოთა დაპირისპირების ნარატივისა, საიდანაც შეგვიძლია ჩინური ვეშაპის ისტორია წავიკითხოთ. იან ლეკუნი, ფრანგი-ამერიკელი კომპიუტერული მეცნიერი და AI "ნათლიმამათაგან" ერთ-ერთი, გვთავაზობს რომ დიფსიქის ფენომენი არა ჩინური და ამერიკული კონკურენციის, არამედ ღია და დახურული მოდელების კონკურენციის ჭრილში დავინახოთ. თავად ლეკუნი მეტას (ფეისბუქის) მთავარი AI მეცნიერია. მეტაში მისი გუნდი ღია კოდის მოდელს “ლამას” ქმნის. მისი თქმით დიფსიქის წარმატება დიდწილად დამოკიდებული იყო ლამას მოდელებსა და სხვა მსგავსი ღია კოდის პროექტების არსებობაზე. ხოლო თავის მხრივ დიფსიქის წარმატება გახდება საფუძველი მომავალში სხვა ღია მოდელების წარმატებისა.
საინტერესოა რომ დიფსიქის გამოჩენა არანკლები თავისტკივილი გახდა ჩინური ტექნოლოგიური გიგანტებისათვის, როგორიცაა ალიბაბა, ტენსენტი, ბაიტდენსი და სხვა. დიფსიქი არ არის არც დიდი კორპორაციული სტრუქტურის ნაწილი, და არც ჩინეთის სახელმწიფოს ინდუსტრიული გეგმის ბენეფიციარი. ის ერთგვარი ნონ-პროფიტ კვლევითი პროექტია ლიან ვენფენის, ბიზნესმენის, რომელიც ფინანსური ფირმის დირერქტორია და აქვს ფუფუნება საკუთარი ფულით დააფინანსოს დიფსიქი როგორც კვლევითი ლაბორატორია. კომპანიის სტრუქტურა სრულიად განსხავვდება სხვა ჩინური (და ასევე ამერიკული) კომპანიებისგან: მცირე ჯგუფი, ძირითადად ახალგაზრდები, რომელთაც ჩინეთის უნივერსიტეტებში მიიღეს განათლება, არაიერარქიული, მოტივირებულები და მოქნილები გარემო. დიფსიქი არის ის რაც უნდა ყოფილიყო OpenAI ღია კვლევითი ორგანიზაცია რომელიც არა კოპრორაციის ან ქვეყნის არამედ კაცობრიობისთვის შექმნიდა ტექნიკურ ინოვაციებს ხელოვნური ინტელექტის გზაზე.
რამდენად გაგრძელდება დიფსიქის ეს კოპრორაციული კულტურა მას შემდეგ რაც მათ მთელი მსოფლიოს (და ჩინეთის კომუნისტური პარტიის) ყურადღება მიიქციეს სხვა საკითხია. თუმცა როგორც ამერიკულ კომპანიებს ისე ჩინურ კომპანიებს უკვე უწევთ უპასუხონ დიფსიქის მიერ ფასების დაწევას და ხელმსიაწვდომობის გაზრდას. ალიბაბამ მალევე გამოუშვა თავისი ახალი მოდელები უფრო იაფად. ხოლო OpenAI პირველად უფასო ვერსიაში გახადა ხელმსიაწვდომი მისი ახალი მოაზროვნე მოდელი o3.
უფრო მეტიც დღეს უკვე ათასობით რეპლიკაციაა დიფსიქის, რომელიც გაუშვეს უნივერსიტეტებმა, კომპანიებმა, თუ ღია კოდის ენთუზიასტებმა. ხვალ რომ დიფსიქის კომპანია სრულიად გაქრეს, ის პროგრესი და ხელმსიაწვდომობა რომელიც მათ შემოგვთავაზეს უკვე შეუქცევადია.
ნაცვლად ორი ზესახელმწიფოს კონკურენციისა შესაძლოა მივიღოთ ხელოვნური ინტელექტის დემოკრატიზაცია და უფრო სწრაფი კომოდიფიკაცია. სვადასხვა კვლევითი ინსტიტუტები, კერძო ბიზნესები დიდი თუ მცირე, არასამთავრობო ორგანიზაციები, თუ უბრალოდ ინდივიდები შეძლებენ ხელოვნური ინტელექტის სიკეთეებით სარგებლობას. ეს თავიდან აგვაცილებს ჩინეთი ან ამერიკის მთავრობასთან შეზრდილი რამოდენიმე დიდი კორპორაციის მიერ ყველა მნიშვენლოვანი გადაწყვეტილების მიღებაზე მონოპოლიას. ასევე აიძულებთ მათ თავიანთი ტექნოლოგიური მიღწევები უფრო ფართოდ გაუზიარონ დანარჩენ სამყაროს.
ნებით თუ უნებლიეთ შეიძლება დიფსიქმა, შედარებით პატარა ჩინურმა კომპანიამ, თავიდან აგვარიდა ავტორიტარული მომავალი სადაც ტრამპის და სი ძინპინის გეოპოლიტიკური პაექრობა შეიძლება კაცობრიობისთვის ეგზისტენციალური საფრთხე გამხდარიყო. შესაძლოა ეს არის ნამდვილი მულტიპოლარული სამყაროს დასაწყისი, სადაც ყველა საზოგადოებას ფლობს ტექნოლოგიას რომელიც მოიცავს მთელი კაცობრიობის ცოდნას. შეიძლება ჯერ ადრეა ასეთი დასკვნის გაკეთება, მაგრამ ფაქტია რომ მომავალი ახლა უფრო იმედის მომცემია ვიდრე 20 იანვრამდე.
ღია კოდის პროგრამის გამოყენება შეუძლია ყველას უფასოდ. თუმცა ხელოვნური მოდელების შემთხვევაში იყენებენ ტერმინს ღია პარამეტრები, რადგან არც ერთი კომპანია საბოლოოდ არ ასაჯაროებს იმ მონაცემებს რომელზეც მოდელები ავარჯიშების. ამის ერთ-ერთი მიზეზად ვარაუდობენ იმას რომ ყველა კომპანია “იპარავს” მონაცემებს.