FinexAkcieSkončí akcie Nvidia, Meta a Alphabet v propadlišti dějin? DeepSeek ukázal, jak trénovat umělou inteligenci levněji a efektivněji!
Skončí akcie Nvidia, Meta a Alphabet v propadlišti dějin? DeepSeek ukázal, jak trénovat umělou inteligenci levněji a efektivněji!
Čínská AI laboratoř DeepSeek přichází s revolučním přístupem k vývoji umělé inteligence. Díky automatizovanému posilovacímu učení dokázala minimalizovat lidský zásah, snížit náklady, a přitom překonat konkurenci.
Čínská laboratoř umělé inteligence DeepSeek použila inovativní techniky k vývoji modelu umělé inteligence, který byl vycvičen s omezeným zásahem člověka.
Vytvořila tak “aha moment”, který by mohl změnit náklady vývojářů na vytváření zabijáckých aplikací založených na této technologii.
Zveřejněná výzkumná práce o fungování modelu R1 společnosti DeepSeek odhaluje, jak skupina vedená miliardářem z hedgeového fondu Liangem Wenfengem dosáhla silných výsledků tím, že odstranila úzká místa ve vývoji AI.
Článek ukazuje, jak společnost DeepSeek přijala řadu efektivnějších technik k vývoji modelu R1, který stejně jako konkurenční model o1 společnosti OpenAI generuje přesné odpovědi tím, že o svých odpovědích “přemýšlí” krok za krokem více než většina velkých jazykových modelů.
Průlomové poznatky DeepSeek vycházejí z použití “posilovacího učení”, které snižuje zapojení člověka do vytváření odpovědí na výzvy.
Společnost také vytvořila menší modely s menším počtem parametrů – množství proměnných používaných k trénování systému AI a formování jeho výstupu – s výkonnými schopnostmi uvažování tím, že upravila velké modely vyškolené konkurenčními společnostmi, jako jsou Meta a Alibaba.
Společně tento vývoj vyvolal šok v celém Silicon Valley, protože R1 překonává některé úlohy ve srovnání s nedávno vydanými modely společností OpenAI, Anthropic a Meta, ale za zlomek peněz na vývoj.
Velké jazykové modely se vytvářejí ve dvou fázích. První se nazývá “pre-training”, při němž vývojáři používají obrovské soubory dat, které modelům pomáhají předvídat další slovo ve větě.
Druhá fáze se nazývá “post-training”, jejímž prostřednictvím vývojáři učí model postupovat podle instrukcí, například řešit matematické úlohy nebo kódovat.
Jedním ze způsobů, jak přimět chatboty generovat užitečnější odpovědi, je tzv. posilovací učení z lidské zpětné vazby (RLHF – reinforcement learning from human feedback), což je technika, kterou jako první zavedla OpenAI s cílem zlepšit ChatGPT.
RLHF funguje tak, že lidští anotátoři označují odpovědi modelu AI na výzvy a vybírají odpovědi, které jsou nejlepší. Tento krok je pracný, nákladný a časově náročný a často vyžaduje malou armádu lidských “štítkovačů” dat.
Velkou inovací společnosti DeepSeek je automatizace tohoto závěrečného kroku pomocí techniky posilovacího učení (RL – reinforcement learning), při níž je model umělé inteligence odměňován za to, že dělá správné věci.
DeepSeek nejprve vyvinula výkonný model pro předpovídání textu nazvaný V3. Poté použila RL k “odměňování” modelu, například mu dala palec nahoru za vygenerování správné odpovědi.
Čínská společnost zjistila, že když tento proces provedla dostatečně častokrát, model dokázal spontánně řešit problémy bez lidského dohledu.
Info
Tuto techniku použil také Google DeepMind k vytvoření AlphaGo, systému umělé inteligence, který před téměř deseti lety porazil lidské hráče ve starobylé deskové hře Go a odstartoval současný boom výpočetních technik hlubokého učení.
DeepSeek uvedla, že zjistila, že model prodělal něco, co společnost nazvala “aha moment”, když přehodnotil své odpovědi a upravil dobu zpracování pro řešení různých otázek.
“Tento aha moment slouží jako mocná připomínka potenciálu posilovacího učení odemknout nové úrovně inteligence v umělých systémech a připravit tak cestu pro autonomnější a adaptivnější modely v budoucnosti,” napsali tvůrci DeepSeek ve své výzkumné zprávě.
Malé modely postavené na základě velkých modelů
Zatímco OpenAI a Google investují miliardy dolarů do budování velkých jazykových modelů, společnost DeepSeek vytvořila také menší modely, které lze spustit v telefonech nebo webových prohlížečích “destilací” rozumových schopností větších modelů.
DeepSeek použila svůj model R1 k vygenerování relativně malé sady 800 000 datových bodů a poté pomocí těchto dat vytvořených umělou inteligencí upravila modely vytvořené konkurenčními společnostmi, jako je Qwen společnosti Alibaba a Llama společnosti Meta.
DeepSeek zjistila, že tyto destilované modely byly obzvláště silné při srovnávání argumentů a v některých případech překonávaly vlajkové modely, jako je Claude společnosti Anthropic.
Tento vývoj by mohl být přínosem pro vývojáře aplikací, kteří tak mají k dispozici levný a efektivní způsob vytváření produktů.
Info
Podle Lennarta Heima, výzkumníka z think-tanku Rand, je učení modelů umělé inteligence uvažovat během inference – v době když model generuje odpovědi – mnohem efektivnější než proces pre-trainingu, který vyžaduje velký výpočetní výkon.
Toto nové paradigma by mohlo umožnit konkurentům vytvářet konkurenceschopné modely s mnohem menším výpočetním výkonem a penězi, dodal.
DeepSeek neuvedla, kolik utratila za vytvoření modelu R1, ale tvrdí, že svůj model V3, na němž je R1 založen, vycvičila za pouhých 5,6 milionu dolarů.
Tato částka však nezahrnuje další náklady, jako je pravděpodobné pořízení tisíců grafických výpočetních jednotek pro trénování modelu, nebo platy, experimenty, školení a nasazení.
A přestože DeepSeek jako první použil své konkrétní techniky, očekává se, že další laboratoře umělé inteligence budou následovat jeho příkladu.
Info
Americké společnosti zabývající se umělou inteligencí rovněž pracují na využití schopností svých velkých, nejmodernějších modelů v menších, svižnějších modelech.
Například Google loni uvedl na trh model Gemma, který je odlehčenější a vychází z jeho modelu Gemini.
Uvažujete o investování do akcií? Zvážit můžete některého z námi recenzovaných brokerů:
U 66,02 % retailových investorů došlo ke vzniku ztráty.
Staňte se součástí naší investiční rodiny na Discordu
Naše komunita je místem, kde se setkávají nováčci i vášniví obchodníci a zkušení investoři. Sdílejte své obchodní tipy, strategie a bavte se o aktuálních událostech na trzích. Každý den je novou příležitostí a každý člen naší komunity může přinést jedinečný pohled na svět financí.
Připojte se k nám a objevte sílu kolektivní moudrosti, která vám pomůže dosáhnout vašich investičních cílů. S námi není obchodování jen o číslech, ale o společenství, které vám dává klíč k úspěchu!
Publicista a aktivní investor s více než desetiletou praxí preferující strategii hodnotového investování.
O investování a finanční trhy se začal zajímat v roce 2013, kdy si prošel náročnou zkušeností jako aktivní denní obchodník. Tato negativní zkušenost vedla k hlubšímu studiu, které mu v následujících letech umožnilo dlouhodobě a úspěšně investovat.
Ve své strategii kombinuje pasivní a aktivní přístup s důrazem na akciové trhy. Inspiraci čerpá z metod Warrena Buffetta a Benjamina Grahama, stejně jako od českého investora Daniela Gladiše. Svým čtenářům předává nabyté vědomosti prostřednictvím článků zaměřených na investiční strategie, psychologii obchodování a analýzy jednotlivých akcií
„Největším nepřítelem investora jsou jeho vlastní emoce.“ – Benjamin Graham
Abychom Vám mohli poskytnout co nejlepší služby, používáme různé technologie, mezi které patří i soubory cookies.
Váš souhlas s použitím těchto technologií nám umožní zpracovávat údaje, jako je Vaše chování při používání našeho webu. Díky tomu můžeme náš web dále zlepšovat. Nesouhlas nebo odvolání souhlasu může nepříznivě ovlivnit určité vlastnosti a funkce těchto webových stránek.
Technické
Vždy aktivní
Technické cookies jsou nezbytně nutné pro legitimní účel umožnění použití služby, kterou si náš čtenář nebo uživatel výslovně vyžádal navštívením stránek a není možné je vypnout.
Předvolby
Technické uložení nebo přístup je nezbytný pro legitimní účel ukládání preferencí, které nejsou požadovány odběratelem nebo uživatelem.
Statistiky
Cookies využívané výhradně pro statistické a analytické účely, abychom naše stránky mohli neustále zlepšovat dle toho, jak se naši čtenáři a uživatelé chovají a jaké mají preference.Technické uložení nebo přístup, který se používá výhradně pro anonymní statistické účely. Bez předvolání, dobrovolného plnění ze strany vašeho Poskytovatele internetových služeb nebo dalších záznamů od třetí strany nelze informace, uložené nebo získané pouze pro tento účel, obvykle použít k vaší identifikaci.
Marketing
Cookies používané k vytvoření uživatelských profilů za účelem zobrazování reklamy nebo sledování chování na webových stránkách pro podobné marketingové účely.
Diskuze (0 komentářů)
Tento článek zatím nikdo neokomentoval. Přihlašte se a buďte první! Napište svůj názor a zahajte diskuzi.