Začněte psát a výsledky vyhledávání se zobrazí zde...

Skončí akcie Nvidia, Meta a Alphabet v propadlišti dějin? DeepSeek ukázal, jak trénovat umělou inteligenci levněji a efektivněji!

Čínská AI laboratoř DeepSeek přichází s revolučním přístupem k vývoji umělé inteligence. Díky automatizovanému posilovacímu učení dokázala minimalizovat lidský zásah, snížit náklady, a přitom překonat konkurenci.

Skončí akcie Nvidia, Meta a Alphabet v propadlišti dějin? DeepSeek ukázal, jak trénovat umělou inteligenci levněji a efektivněji!
Zdroj: Midjourney.com

Čínská laboratoř umělé inteligence DeepSeek použila inovativní techniky k vývoji modelu umělé inteligence, který byl vycvičen s omezeným zásahem člověka.

Vytvořila tak “aha moment”, který by mohl změnit náklady vývojářů na vytváření zabijáckých aplikací založených na této technologii.

Zveřejněná výzkumná práce o fungování modelu R1 společnosti DeepSeek odhaluje, jak skupina vedená miliardářem z hedgeového fondu Liangem Wenfengem dosáhla silných výsledků tím, že odstranila úzká místa ve vývoji AI.

 

Článek ukazuje, jak společnost DeepSeek přijala řadu efektivnějších technik k vývoji modelu R1, který stejně jako konkurenční model o1 společnosti OpenAI generuje přesné odpovědi tím, že o svých odpovědích “přemýšlí” krok za krokem více než většina velkých jazykových modelů.

Průlomové poznatky DeepSeek vycházejí z použití “posilovacího učení”, které snižuje zapojení člověka do vytváření odpovědí na výzvy.

Společnost také vytvořila menší modely s menším počtem parametrů – množství proměnných používaných k trénování systému AI a formování jeho výstupu – s výkonnými schopnostmi uvažování tím, že upravila velké modely vyškolené konkurenčními společnostmi, jako jsou Meta a Alibaba.

Společně tento vývoj vyvolal šok v celém Silicon Valley, protože R1 překonává některé úlohy ve srovnání s nedávno vydanými modely společností OpenAI, Anthropic a Meta, ale za zlomek peněz na vývoj.

Aktuální vývoj ceny akcií Meta a Alibaba

Aktuální cena
Změna
Načítání
Načítání
Načítání
Načítání
Načítání
Načítání
Koupit akcie FB! Váš kapitál může být ohrožen*

Logo sponzora Koupit!

Palce nahoru vedou k “aha momentu”

Velké jazykové modely se vytvářejí ve dvou fázích. První se nazývá “pre-training”, při němž vývojáři používají obrovské soubory dat, které modelům pomáhají předvídat další slovo ve větě.

Druhá fáze se nazývá “post-training”, jejímž prostřednictvím vývojáři učí model postupovat podle instrukcí, například řešit matematické úlohy nebo kódovat.

Jedním ze způsobů, jak přimět chatboty generovat užitečnější odpovědi, je tzv. posilovací učení z lidské zpětné vazby (RLHF – reinforcement learning from human feedback), což je technika, kterou jako první zavedla OpenAI s cílem zlepšit ChatGPT.

RLHF funguje tak, že lidští anotátoři označují odpovědi modelu AI na výzvy a vybírají odpovědi, které jsou nejlepší. Tento krok je pracný, nákladný a časově náročný a často vyžaduje malou armádu lidských “štítkovačů” dat.

Velkou inovací společnosti DeepSeek je automatizace tohoto závěrečného kroku pomocí techniky posilovacího učení (RL – reinforcement learning), při níž je model umělé inteligence odměňován za to, že dělá správné věci.

DeepSeek nejprve vyvinula výkonný model pro předpovídání textu nazvaný V3. Poté použila RL k “odměňování” modelu, například mu dala palec nahoru za vygenerování správné odpovědi.

Čínská společnost zjistila, že když tento proces provedla dostatečně častokrát, model dokázal spontánně řešit problémy bez lidského dohledu.

Info

Tuto techniku použil také Google DeepMind k vytvoření AlphaGo, systému umělé inteligence, který před téměř deseti lety porazil lidské hráče ve starobylé deskové hře Go a odstartoval současný boom výpočetních technik hlubokého učení.

DeepSeek uvedla, že zjistila, že model prodělal něco, co společnost nazvala “aha moment”, když přehodnotil své odpovědi a upravil dobu zpracování pro řešení různých otázek.

“Tento aha moment slouží jako mocná připomínka potenciálu posilovacího učení odemknout nové úrovně inteligence v umělých systémech a připravit tak cestu pro autonomnější a adaptivnější modely v budoucnosti,” napsali tvůrci DeepSeek ve své výzkumné zprávě.

Malé modely postavené na základě velkých modelů

Zatímco OpenAI a Google investují miliardy dolarů do budování velkých jazykových modelů, společnost DeepSeek vytvořila také menší modely, které lze spustit v telefonech nebo webových prohlížečích “destilací” rozumových schopností větších modelů.

DeepSeek použila svůj model R1 k vygenerování relativně malé sady 800 000 datových bodů a poté pomocí těchto dat vytvořených umělou inteligencí upravila modely vytvořené konkurenčními společnostmi, jako je Qwen společnosti Alibaba a Llama společnosti Meta.

DeepSeek zjistila, že tyto destilované modely byly obzvláště silné při srovnávání argumentů a v některých případech překonávaly vlajkové modely, jako je Claude společnosti Anthropic.

Tento vývoj by mohl být přínosem pro vývojáře aplikací, kteří tak mají k dispozici levný a efektivní způsob vytváření produktů.

Info

Podle Lennarta Heima, výzkumníka z think-tanku Rand, je učení modelů umělé inteligence uvažovat během inference – v době když model generuje odpovědi – mnohem efektivnější než proces pre-trainingu, který vyžaduje velký výpočetní výkon.

Toto nové paradigma by mohlo umožnit konkurentům vytvářet konkurenceschopné modely s mnohem menším výpočetním výkonem a penězi, dodal.

DeepSeek neuvedla, kolik utratila za vytvoření modelu R1, ale tvrdí, že svůj model V3, na němž je R1 založen, vycvičila za pouhých 5,6 milionu dolarů.

Tato částka však nezahrnuje další náklady, jako je pravděpodobné pořízení tisíců grafických výpočetních jednotek pro trénování modelu, nebo platy, experimenty, školení a nasazení.

A přestože DeepSeek jako první použil své konkrétní techniky, očekává se, že další laboratoře umělé inteligence budou následovat jeho příkladu.

Info

Americké společnosti zabývající se umělou inteligencí rovněž pracují na využití schopností svých velkých, nejmodernějších modelů v menších, svižnějších modelech.

Například Google loni uvedl na trh model Gemma, který je odlehčenější a vychází z jeho modelu Gemini.

Uvažujete o investování do akcií? Zvážit můžete některého z námi recenzovaných brokerů:

Favorit redakce

Při obchodování CFD s tímto poskytovatelem ztrácí 74 % účtů retailových investorů peníze.
Výhody
  • Nákup a prodej akcií i ETF bez poplatku
  • Možnost nákupu frakčních práv a ETF
Nevýhody
  • Absence některých oblíbených finančních instrumentů – opce, dluhopisy, podílové fondy apod.
  • Danění českých dividend 35% sazbou
U 51 % retailových investorů došlo při obchodování CFD u této společnosti ke vzniku ztráty.
U 66,02 % retailových investorů došlo ke vzniku ztráty.

Staňte se součástí naší investiční rodiny na Discordu

Naše komunita je místem, kde se setkávají nováčci i vášniví obchodníci a zkušení investoři. Sdílejte své obchodní tipy, strategie a bavte se o aktuálních událostech na trzích. Každý den je novou příležitostí a každý člen naší komunity může přinést jedinečný pohled na svět financí.

Připojte se k nám a objevte sílu kolektivní moudrosti, která vám pomůže dosáhnout vašich investičních cílů. S námi není obchodování jen o číslech, ale o společenství, které vám dává klíč k úspěchu!

Pokud s Discordem teprve začínáte, připravili jsme pro vás také stručný návod, jak ho používat.

Líbil se vám tento článek?
0
5

Autor

Publicista a aktivní investor s více než desetiletou praxí preferující strategii hodnotového investování.

O investování a finanční trhy se začal zajímat v roce 2013, kdy si prošel náročnou zkušeností jako aktivní denní obchodník. Tato negativní zkušenost vedla k hlubšímu studiu, které mu v následujících letech umožnilo dlouhodobě a úspěšně investovat.

Ve své strategii kombinuje pasivní a aktivní přístup s důrazem na akciové trhy. Inspiraci čerpá z metod Warrena Buffetta a Benjamina Grahama, stejně jako od českého investora Daniela Gladiše. Svým čtenářům předává nabyté vědomosti prostřednictvím článků zaměřených na investiční strategie, psychologii obchodování a analýzy jednotlivých akcií

„Největším nepřítelem investora jsou jeho vlastní emoce.“ – Benjamin Graham

Přečíst více

Sdílejte tento článek

Mohlo by vás zajímat

Diskuze (0 komentářů)

Připojte se k diskuzi

Tento článek zatím nikdo neokomentoval. Přihlašte se a buďte první! Napište svůj názor a zahajte diskuzi.