Sekėjai

Ieškoti šiame dienoraštyje

2023 m. spalio 31 d., antradienis

Kaip Kinija tapo automobilius eksportuojančia čempione

  „Automobilių entuziastai dažniausiai patenka į vieną iš dviejų stovyklų: tie, kurie žavisi vokiečių automobilių inžinerijos galia ir greičiu; ir tie, kurie mano, kad japoniški automobiliai yra pranašesni, žavisi jų patikimumu ir kainos ir kokybės santykiu.

 

     Dešimtmečius šios dvi šalys grūmėsi dėl pirmaujančios pasaulyje automobilių eksportuotojos vardo. Tačiau poros dominavimas baigiasi.

 

     Jau dabar didžiausia pasaulyje automobilių gamintoja Kinija siekia aplenkti jos konkurentus ir eksporto srityje.

 

     Dar prieš keletą metų Kinijos automobilių gamintojų bandymai plėstis į užsienio rinkas strigo. 2015 m. Kinija eksportavo mažiau, nei 375 000, automobilių per metus, mažiau, nei Indija, ir maždaug tiek pat, kiek Vokietija ir Japonija per vieną mėnesį. Tačiau maždaug 2020 metais šalis pakeitė pavaras. 2021 metais Kinija eksportavo beveik 1,6 mln. automobilių. Iki 2022 m. jis pasiekė 2,7 mln. Numatoma, kad 2023 m. tarptautiniai pardavimai dar padidės. Muitinės duomenys rodo, kad per pirmuosius šešis metų mėnesius šalis išsiuntė beveik 2 mln. automobilių arba daugiau, nei 10 000, per dieną.

 

     Kinijoje besikurianti automobilių pramonė daugiausia eksportuoja į neturtingas šalis, tačiau dabar daugelis Vakarų vartotojų Kinijoje pagamintus automobilius perka pirmą kartą. Eksportas į Australiją 2023 m. pirmąjį pusmetį kasmet išaugo tris kartus, iki daugiau, nei 100 000, automobilių; pardavimai Ispanijai išaugo 17 kartų iki beveik 70 000 transporto priemonių. Tačiau daugelis šių automobilių yra vakarietiškų prekių ženklų. Maždaug dešimtadalis 2022 m. eksportuotų transporto priemonių buvo pagaminta iš Amerikos elektromobilių prekės ženklo Tesla. „MG“, pradėjusi, kaip britų markė, ir „Volvo“, Švedijos automobilių gamintoja, dabar priklauso Kinijos įmonėms. Jų modeliai taip pat sudaro didelę dalį į užsienį siunčiamų automobilių.

 

     Šalies patirtis elektromobilių (EV) srityje iš dalies yra atsakinga už eksporto padidėjimą. Nepaisant visų gamybos galimybių, Kinija niekada neįvaldė vidaus degimo variklių, turinčių šimtus judančių dalių, ir kuriuos sudėtinga surinkti.

 

     Kinijai pasivyti padėjo baterijomis varomų transporto priemonių, kurios yra mechaniškai paprastesnės ir lengviau pagaminamos, atsiradimas. Valstybės investicijos į elektromobilių technologiją, kurios 2009–2019 m. sudarė 676 mlrd. juanių (100 mlrd. dolerių), iškėlė šalį į pirmąją vietą. Šiandien baterijomis varomos transporto priemonės sudaro penktadalį Kinijos parduodamų automobilių ir trečdalį eksporto. Japonijoje ir Vokietijoje atitinkamai tik 4% ir 20% eksporto sudaro elektra.

 

     Ukrainos įvykiai taip pat padidino Kinijos eksportą į Rusiją. Po sankcijų Rusijai 2022 m. vasario mėn., dauguma Vakarų automobilių gamintojų nutraukė savo veiklą Rusijoje. Jų pasitraukimas leido jų Kinijos konkurentams užimti rinkos dalį. 2023 m. pirmąjį pusmetį Rusija importavo beveik 300 000 kiniškų automobilių už 4,5 mlrd. dolerių.

 

     Panašu, kad Kinijos eksporto juggernautas greitai nesulėtės. Konsultacijų bendrovė „AlixPartners“ skaičiuoja, kad 2030 m. kiniškais prekės ženklais pažymėtų automobilių užsienyje pardavimas gali siekti 9 mln. transporto priemonių, o tai dvigubai viršys Japonijos eksportą 2022 m.

 

     Nors šie naminiai prekių ženklai Vakaruose vis dar gana nežinomi, automobiliai, kurie paprastai yra pigūs – vidutiniškai Kinijoje pagaminti automobiliai kainuoja maždaug 40 % mažiau, nei pagaminti Vokietijoje – yra populiarūs besivystančiose rinkose, pavyzdžiui, Brazilijoje.

 

     Priešakyje dar laukia greičio mažinimo kalneliai. Kinijos elektromobilių gamintojai gali siekti didelių pardavimų, tačiau nedaugelis uždirba pinigų. Pramonę remia valstybės subsidijos, neseniai atnaujintos sulėtėjus pardavimų augimui. Tačiau subsidijos gali tęstis ne amžinai.

 

     Diagramos šaltiniai: UN Comtrade; vyriausybės statistika“. [1]

 

1. "How China became a car-exporting juggernaut." The Economist, 12 Aug. 2023, p. NA.

How China became a car-exporting juggernaut.


"CAR ENTHUSIASTS tend to fall into one of two camps: those who fawn over the power and speed of German automotive engineering; and those who think Japanese cars are superior, admiring their reliability and value for money.

For decades the two countries have jostled for position as the world's leading car exporter. But the pair's dominance is coming to an end.

Already the world's largest car manufacturer, China is on track to overtake its rivals in exports, too.

Until just a few years ago, attempts by Chinese carmakers to expand into foreign markets had stalled. In 2015 China exported under 375,000 cars a year, fewer than India, and about as many as Germany and Japan shipped in a single month. But in around 2020, the country changed gears. In 2021 China exported nearly 1.6m cars. By 2022 it hit 2.7m. International sales are set to rev up further in 2023. Customs data show that the country shipped nearly 2m cars in the first six months of the year, or more than 10,000 a day.

China's nascent auto industry mainly exported to poor countries, but now many Western consumers are buying Chinese-made cars for the first time. Exports to Australia tripled year on year in the first half of 2023, to more than 100,000 cars; sales to Spain rose 17-fold to nearly 70,000 vehicles. But many of these cars are Western-branded. Roughly a tenth of vehicles exported in 2022 came from Tesla, an American electric-car brand. MG, which started as a British marque, and Volvo, a Swedish carmaker, are now owned by Chinese companies. Their models also make up a large chunk of the cars sent overseas.

The country's expertise in electric vehicles (EVs) is partly responsible for the surge in exports. For all its manufacturing might, China never mastered internal-combustion engines, which have hundreds of moving parts and are tricky to assemble.

The arrival of battery-powered vehicles, which are mechanically simpler and easier to build, helped China catch up. State investment in the EV technology, an estimated 676bn yuan ($100bn) between 2009 and 2019, put the country in pole position. Today battery-powered vehicles account for a fifth of car sales in China and a third of exports. In Japan and Germany only 4% and 20% of exports, respectively, are electric.

Ukraina’s events have also turbocharged Chinese exports to Russia. After sanctions on Russia in February 2022 most Western carmakers ceased their Russian operations. Their exit allowed their Chinese rivals to capture market share. In the first half of 2023 Russia imported nearly 300,000 Chinese cars worth $4.5bn, a six-fold increase on 2022. In July Chinese cars accounted for nearly 80% of imports, according to Autostat, an analytics firm.

China's export juggernaut looks unlikely to slow soon. AlixPartners, a consultancy, estimates that foreign sales of Chinese-branded cars could reach 9m vehicles by 2030, double Japan's exports in 2022.

Although these homegrown brands are still relatively unknown in the West, the cars, which tend to be cheap—on average Chinese-made vehicles cost roughly 40% as much as German-made ones—are popular in emerging markets such as Brazil.

There are still speed bumps ahead. Chinese EV-makers may be chalking up big sales, yet few are making money. The industry is propped up by state subsidies, recently renewed after slowing sales growth. But subsidies may not last forever.

Chart sources: UN Comtrade; government statistics.” [1]

1. "How China became a car-exporting juggernaut." The Economist, 12 Aug. 2023, p. NA.

Dirbtinis intelektas pradeda dideles grumtynes dėl duomenų

   „Ne taip seniai analitikai atvirai svarstė, ar dirbtinis intelektas (AI) bus kompanijos „Adobe“, kuriančios programinę įrangą kūrybingiems tipams, mirtis. Atrodė, kad tokie nauji įrankiai, kaip DALL-E 2 ir „Midjourney“, kurie sukuria paveikslėlius iš teksto „Adobe“ vaizdų redagavimo pasiūlymus daro nereikalingais. Dar balandžio mėn. „Seeking Alpha“, finansų naujienų svetainė, paskelbė straipsnį „Ar AI yra „Adobe“ žudikas?

 

     Toli nuo to. „Adobe“ panaudojo savo šimtų milijonų nuotraukų duomenų bazę, kad sukurtų savo dirbtinio intelekto įrankių rinkinį, pavadintą „Firefly“. Nuo pat išleidimo kovo mėn. programinė įranga buvo naudojama, kuriant daugiau, nei 1 mlrd., vaizdų, sako Dana Rao, įmonės vadovė. „Adobe“tai daro,  vengdama ieškoti vaizdų internete, kaip tai darė konkurentai, „Adobe“ išvengė gilėjančio ginčo dėl autorių teisių, kurie dabar slegia pramonę. 

 

Nuo „Firefly“ pasirodymo įmonės akcijų kaina pakilo 36%.

 

     „Adobe“ triumfas prieš smerkiančiuosius iliustruoja platesnę mintį apie konkursą dėl dominavimo sparčiai besivystančioje AI įrankių rinkoje. Supersize modeliai, maitinantys naujausią vadinamojo „generatyvinio“ AI bangą, priklauso nuo daugybės duomenų. Jau pasinaudojusios didžiąja dalimi interneto, dažnai be leidimo, dirbtinio intelekto įmonės dabar ieško naujų duomenų šaltinių, kad palaikytų maitinimosi įtūžį. Tuo tarpu įmonės, turinčios daugybę duomenų, svarsto, kaip geriausia iš to pasipelnyti. Šiuo metu vyksta duomenų gavimas.

 

     Du pagrindiniai AI modelio komponentai yra duomenų rinkiniai, kuriais remiantis apmokoma sistema, ir apdorojimo galia, per kurią modelis nustato ryšius tuose duomenų rinkiniuose ir tarp jų. Šie du ingredientai tam tikru mastu yra vienas kito pakaitalai: modelį galima patobulinti, sunaudojant daugiau duomenų arba pridedant daugiau apdorojimo galios. Tačiau pastarasis ėjimas tampa sudėtingas dėl specializuotų AI lustų trūkumo, todėl modelių kūrėjai turi dvigubai daugiau dėmesio skirti duomenų paieškai.

 

     Duomenų poreikis auga taip greitai, kad iki 2026 m. gali būti išnaudotos aukštos kokybės teksto, skirto mokymams, atsargos, skaičiuoja Epoch AI, tyrimų komanda. 

 

Naujausi dviejų technologijų milžinų „Google“ ir „Meta“ AI modeliai, greičiausiai, yra išmokyti, naudojant daugiau, nei 1 trilijoną, žodžių. Palyginimui, bendra angliškų žodžių suma internetinėje enciklopedijoje Vikipedija yra apie 4 mlrd.

 

     Svarbu ne tik duomenų rinkinių dydis. Kuo geresni duomenys, tuo geresnis modelis. Tekstu pagrįsti modeliai yra idealiai mokomi rašyti, naudojant ilgos formos, gerai parašytus, faktiškai tiksliai parašytus, tekstus, pažymi Russellas Kaplanas iš Scale AI, duomenų startuolio. Labiau tikėtina, kad modeliai, kuriuose pateikiama ši informacija, gamins panašiai aukštos kokybės produkciją. Taip pat AI pokalbių robotai pateikia geresnius atsakymus, kai jų prašoma žingsnis po žingsnio paaiškinti, kaip jie veikia, todėl didėja šaltinių, pvz., vadovėlių, paklausa. Taip pat vertinami specializuoti informacijos rinkiniai, nes jie leidžia modelius „patobulinti“, kad būtų galima pritaikyti daugiau nišų. 2018 m. „Microsoft“ įsigijo „GitHub“, programinės įrangos kodo saugyklą, už 7,5 mlrd. dolerių, kas padėjo sukurti kodų rašymo dirbtinio intelekto įrankį.

 

     Augant duomenų paklausai, prieiga prie jų tampa vis sudėtingesnė, o turinio kūrėjai dabar reikalauja kompensacijos už medžiagą, kuri buvo įtraukta į AI modelius. Modelių kūrėjams Amerikoje jau iškelta nemažai bylų dėl autorių teisių pažeidimo. Grupė autorių, įskaitant komikę Sarah Silverman, padavė į teismą OpenAI, ChatGPT, AI pokalbių roboto kūrėją ir konkuruojančią kompaniją Meta. Grupė menininkų taip pat kreipiasi į teismą, kaltindami „Stability AI“, kuriančią teksto į vaizdą įrankius, ir „Midjourney“.

 

     Rezultatas buvo didžiulis sandorių sudarymas, kai dirbtinio intelekto įmonės lenktyniauja, siekdamos apsaugoti duomenų šaltinius. Liepos mėnesį OpenAI pasirašė susitarimą su naujienų agentūra Associated Press, kad pasiektų jos istorijų archyvą. Neseniai ji taip pat išplėtė sutartį su „Shutterstock“, fotografijos tiekėju, su kuria „Meta“ taip pat yra sudariusi sandorį. Rugpjūčio 8 d. buvo pranešta, kad „Google“ diskutuoja su įrašų kompanija „Universal Music“, siekdama licencijuoti atlikėjų balsus dainų kūrimo AI įrankiui. Sklando gandai apie tai, kad dirbtinio intelekto laboratorijos artėja prie Britanijos visuomeninio transliuotojo BBC. Kitas numanomas tikslas yra JSTOR, skaitmeninė akademinių žurnalų biblioteka.

 

     Informacijos turėtojai naudojasi didesne derybine galia. Diskusijų forumas „Reddit“ ir programuotojų pamėgta klausimų ir atsakymų svetainė „Stack Overflow“ padidino prieigos prie jų duomenų kainą. Abi svetainės yra ypač vertingos, nes vartotojai „užbalsuoja“ pageidaujamus atsakymus, padėdami modeliams žinoti, kurie yra tinkamiausi. Socialinės žiniasklaidos svetainė „Twitter“ (dabar žinoma, kaip X) ėmėsi priemonių, kad apribotų robotų galimybę iškrapštyti svetainę, ir dabar apmokestina visus, kurie nori pasiekti jos duomenis. Elonas Muskas, jos savininkas, planuoja sukurti savo dirbtinio intelekto verslą, naudodamas šiuos duomenis.

 

     Išplečiant sieną

 

     Todėl modelių kūrėjai daug dirba, kad pagerintų jau turimų įvesties kokybę. Daugelis AI laboratorijų naudoja daugybę duomenų anotatorių, kad galėtų atlikti tokias užduotis, kaip vaizdų žymėjimas ir įvertinimas atsakymai. Kai kurie iš šių darbų yra sudėtingi; vieno tokio darbo skelbime ieškoma gyvybės mokslų magistro arba daktaro laipsnį turinčių pretendentų. Tačiau didžioji jo dalis yra kasdieniška ir perkeliama į tokias vietas, kaip Kenija, kur darbo jėga pigi.

 

     Dirbtinio intelekto įmonės taip pat renka duomenis, kai vartotojai sąveikauja su įmonių įrankiais. Daugelis jų turi grįžtamojo ryšio mechanizmą, kuriame vartotojai nurodo, kurie atsakymai yra naudingi. „Firefly“ teksto į vaizdą generatorius leidžia vartotojams pasirinkti vieną iš keturių parinkčių. Bardas, „Google“ pokalbių robotas, siūlo tris atsakymus. Vartotojai gali pažymėti „ChatGPT“ atsakymus „patinka“ arba „nepatinka“. Šią informaciją galima grąžinti, kaip įvestį į pagrindinį modelį, suformuojant tai, ką Douwe Kiela, Contextual AI, startuolio, įkūrėjas, vadina „duomenų smagračiu“. Jis priduria, kad stipresnis pokalbių roboto atsakymų kokybės signalas yra tai, ar vartotojai nukopijuoja tekstą ir įklijuoja jį kitur. Ši informacija padėjo „Google“ greitai patobulinti jos vertimo įrankį.

 

     Tačiau yra vienas duomenų šaltinis, kuris iš esmės lieka nepanaudotas: informacija, esanti tarp technologijų įmonių verslo klientų sienų. Daugelis įmonių, dažnai nesąmoningai, turi daug naudingų duomenų – nuo skambučių centro nuorašų iki klientų išlaidų įrašų. Tokia informacija ypač vertinga, nes ji gali būti naudojama modeliams patikslinti konkretiems verslo tikslams, pavyzdžiui, padėti skambučių centro darbuotojams atsakyti į užklausas arba analitikams rasti būdus, kaip padidinti pardavimą.

 

     Tačiau pasinaudoti šiais turtingais ištekliais ne visada paprasta. Roy Singh iš Bain, konsultacinės įmonės, pažymi, kad dauguma įmonių istoriškai mažai dėmesio skyrė didžiulių, bet nestruktūrizuotų duomenų rinkinių tipams, kurie būtų naudingiausi, mokant dirbtinio intelekto įrankius. Dažnai jie yra pasklidę įvairiose sistemose, paslėpti įmonės serveriuose, o ne debesyje.

 

     Šios informacijos atrakinimas padėtų įmonėms pritaikyti AI įrankius, kad jie geriau atitiktų jų poreikius.

 

     „Amazon“ ir „Microsoft“, dvi technologijų gigantės, dabar siūlo įrankius, padedančius įmonėms pagerinti savo nestruktūrizuotų duomenų rinkinių valdymą, tai daro ir „Google“.

 

     Christianas Kleinermanas iš „Snowflake“, duomenų bazių įmonės, teigia, kad verslas klesti, nes klientai nori „nugriauti duomenų kaupiklius“. Daugėja pradedančiųjų įmonių. Balandžio mėn. Weaviate, į dirbtinį intelektą orientuota duomenų bazių įmonė, surinko 50 mln. dolerių, įvertinant ją 200 mln. dolerių. Vos po savaitės PineCone, konkurentė, surinko 100 mln. dolerių, įvertinant ją 750 mln. dolerių. Anksčiau šį mėnesį Neon, kitas duomenų bazių startuolis, surinko papildomus 46 mln. dolerių. Duomenų grumtynės dar tik prasideda." [1]

 

1. "AI is setting off a great scramble for data." The Economist, 13 Aug. 2023, p. NA.

AI is setting off a great scramble for data.


"Not so long ago analysts were openly wondering whether artificial intelligence (AI) would be the death of Adobe, a maker of software for creative types. New tools like DALL-E 2 and Midjourney, which conjure up pictures from text, seemed set to render Adobe's image-editing offerings redundant. As recently as April, Seeking Alpha, a financial-news site, published an article headlined "Is AI the Adobe killer?"

Far from it. Adobe has used its database of hundreds of millions of stock photos to build its own suite of AI tools, dubbed Firefly. Since its release in March the software has been used to create over 1bn images, says Dana Rao, a company executive. By avoiding mining the internet for images, as rivals did, Adobe has skirted the deepening dispute over copyright that now dogs the industry. The firm's share price has risen by 36% since Firefly was launched.

Adobe's triumph over the doomsters illustrates a wider point about the contest for dominance in the fast-developing market for AI tools. The supersize models powering the latest wave of so-called "generative" AI rely on oodles of data. Having already helped themselves to much of the internet, often without permission, AI firms are now seeking out new data sources to sustain the feeding frenzy. Meanwhile, companies with vast troves of the stuff are weighing up how best to profit from it. A data land grab is under way.

The two essential ingredients for an AI model are datasets, on which the system is trained, and processing power, through which the model detects relationships within and among those datasets. Those two ingredients are, to an extent, substitutes: a model can be improved either by ingesting more data or adding more processing power. The latter, however, is becoming difficult owing to a shortage of specialist AI chips, leading model-builders to be doubly focused on seeking out data.

Demand for data is growing so fast that the stock of high-quality text available for training may be exhausted by 2026, reckons Epoch AI, a research outfit. The latest AI models from Google and Meta, two tech giants, are likely trained on over 1trn words. By comparison, the sum total of English words on Wikipedia, an online encyclopedia, is about 4bn.

It is not only the size of datasets that counts. The better the data, the better the model. Text-based models are ideally trained on long-form, well-written, factually accurate writing, notes Russell Kaplan of Scale AI, a data startup. Models fed this information are more likely to produce similarly high-quality output. Likewise, AI chatbots give better answers when asked to explain their working step by step, increasing demand for sources like textbooks. Specialised information sets are also prized, as they allow models to be "fine-tuned" for more niche applications. Microsoft's purchase of GitHub, a repository for software code, for $7.5bn in 2018 helped it develop a code-writing AI tool.

As demand for data grows, accessing it is getting trickier, with content creators now demanding compensation for material that has been ingested into AI models. A number of copyright-infringement cases have already been brought against model-builders in America. A group of authors, including Sarah Silverman, a comedian, are suing OpenAI, maker of ChatGPT, an AI chatbot, and Meta. A group of artists are similarly suing Stability AI, which builds text-to-image tools, and Midjourney.

The upshot has been a flurry of dealmaking as AI companies race to secure data sources. In July OpenAI inked a deal with Associated Press, a news agency, to access its archive of stories. It has also recently expanded an agreement with Shutterstock, a provider of stock photography, with which Meta has a deal, too. On August 8th it was reported that Google was in discussions with Universal Music, a record label, to license artists' voices to feed a songwriting AI tool. Rumours swirl about AI labs approaching the BBC, Britain's public broadcaster. Another supposed target is JSTOR, a digital library of academic journals.

Holders of information are taking advantage of their greater bargaining power. Reddit, a discussion forum, and Stack Overflow, a question-and-answer site popular with coders, have increased the cost of access to their data. Both websites are particularly valuable because users "upvote" preferred answers, helping models know which are most relevant. Twitter (now known as X), a social-media site, has put in place measures to limit the ability of bots to scrape the site and now charges anyone who wishes to access its data. Elon Musk, its mercurial owner, is planning to build his own AI business using the data.

Expanding the frontier

As a consequence, model-builders are working hard to improve the quality of the inputs they already have. Many AI labs employ armies of data annotators to perform tasks such as labelling images and rating answers. Some of that work is complex; an advert for one such job seeks applicants with a master's degree or doctorate in life sciences. But much of it is mundane, and is being outsourced to places such as Kenya where labour is cheap.

AI firms are also gathering data through users' interactions with their tools. Many of these have a feedback mechanism, where users indicate which outputs are useful. Firefly's text-to-image generator allows users to pick from one of four options. Bard, Google's chatbot, proposes three answers. Users can give ChatGPT a thumbs-up or thumbs-down to its responses. That information can be fed back as an input into the underlying model, forming what Douwe Kiela, co-founder of Contextual AI, a startup, calls the "data flywheel". A stronger signal still of the quality of a chatbot's answers is whether users copy the text and paste it elsewhere, he adds. That information helped Google rapidly improve its translation tool.

There is, however, one source of data that remains largely untapped: the information that exists within the walls of the tech firms' corporate customers. Many businesses possess, often unwittingly, vast amounts of useful data, from call-centre transcripts to customer spending records. Such information is especially valuable because it can be used to fine-tune models for specific business purposes, such as helping call-centre workers answer queries or analysts spot ways to boost sales.

Yet making use of that rich resource is not always straightforward. Roy Singh of Bain, a consultancy, notes that most firms have historically paid little attention to the types of vast but unstructured datasets that would prove most useful for training AI tools. Often these are spread across various systems, buried in company servers rather than in the cloud.

Unlocking that information would help companies customise AI tools to serve their needs better.

Amazon and Microsoft, two tech giants, now offer tools to help companies improve management of their unstructured datasets, as does Google.

Christian Kleinerman of Snowflake, a database firm, says that business is booming as clients look to "tear down data silos". Startups are piling in. In April Weaviate, an AI-focused database business, raised $50m at a valuation of $200m. Barely a week later PineCone, a rival, raised $100m at a $750m valuation. Earlier this month Neon, another database startup, raised an additional $46m in funding. The scramble for data is only just getting started.” [1]

1. "AI is setting off a great scramble for data." The Economist, 13 Aug. 2023, p. NA.