Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

常为希 🔸🚢币安人生(Ai奇点)
Jednoduché a složité Kde se kámen zastaví, kde 🌱 voda proudí DYOR udělejte si vlastní průzkum | NFA nemá finanční poradenství
Trh s paměťmi prochází extrémním strukturálním nedostatkem "jednou za 40 let" a tato vlna supercyklů vyvolaných AI je větší, trvá déle, dosahuje vrcholu a je daleko od vrcholu.
Nyní podrobně vysvětlím krok za krokem na základě modelu kapacity po továrně a celkového rozdělení poptávky:
Paměťový průmysl je dlouho považován za cyklický průmysl a paměťový průmysl má klasický cyklus každé 3–4 roky už více než deset let: nadnabídka→ pokles cen→ výrobci omezují/zdržují rozšiřování výroby→ nedostatky→ ceny prudce stoupají→ šílená expanze → přebytek. Ale poslední doba, kdy byla intenzita srovnatelná s dnešním "zdvojnásobením cen + prudkým růstem hrubých ziskových marží", se přičítá nedostatku DRAM v polovině až koncem 80. let, který přímo vytvořil globální hegemonii korejských továren jako Samsung.
Rozdíl v tomto kole spočívá v jádru: ne v oživení poptávky, ale v explozivní, udržitelné a nepředvídatelné poptávce po AI infrastruktuře. Trénování + inference vyžaduje masivní HBM jako lokální cache GPU/akcelerátoru a intenzita paměti na každý systém vykazuje nelineární skok, podobně jako v éře PC, smartphonů a cloudech, ale objem a strmost jsou mnohem větší než dříve. Výroba HBM je vysoce oligopolní (SK Hynix má 50–60 % podílu, Samsung + Micron sdílí přebytek), pokročilé balení (třída TSV + CoWoS), úzká místa, rostoucí výnosy a cykly dodávek zařízení trvají několik let, což vede k vážné nerovnováze v dodávce od roku 2026 do roku 2027, i když výrobci půjdou naplno.
Výsledkem je, že ceny se už mnoho čtvrtletí po sobě "zdvojnásobují" a my jsme ani zdaleka nedosahovali vrcholu.
Na finanční úrovni tři hlavní paměťové továrny přinesly historické ziskové okno:
- SK hynix: HBM byl vyprodán až do roku 2026, přičemž je upřednostněn vysoce maržový HBM, a běžná DRAM je také nedostatková kvůli preempci AI serverů, přičemž nárůst dokonce převyšuje HBM, a očekává se, že tržby/zisk/hrubá zisková marže v roce 2026 výrazně překročí očekávání.
- Samsung: Akcie HBM zaostávají, ale celkový objem DRAM/NAND je obrovský a současný nárůst cen tradičních DRAM přinesl "nečekané zisky" a nejstabilnější peněžní tok.
- Micron: Pokrok HBM je pomalejší, ale podpora politiky s nízkou základnou + americkou politikou, s největší elasticitou, a nedostatek běžné DRAM také prospívá.
ROIC celého odvětví prudce vzrostl, ačkoliv kapitálové výdaje jsou vysoké, pokrývá je ultra-vysoký hrubý zisk a hrubá zisková marže se může v některých oblastech vrátit na 50 %+ nebo i vyšší, čímž zcela naruší tradiční tržní kotvou "hrubé ziskové marže cyklických akcií 20–30 %".
Po roce 2027 se může rychle změnit v přebytek, podobně jako při krachu pamětí na konci let 2017–2018, kdy ceny budou poloviční, hrubé marže klesnou a dokonce i ztráty. Ale zatím to není vidět, poptávka po výpočetním výkonu je nekonečná a snaží se dosáhnout Agi, a ještě nenastala doba, kdy by všichni byli AI, stejně jako když Apple přišel dřív, než všichni měli mobilní telefony.
Jde o "jednou za 40 let" paměťový supercyklus detonace AI a extrémní rigidity dodávek, rok 2026 je stále vzestupnou fází dvojnásobného kliknutí cen a zisků, SK hynix je nejelastickější, Micron je nejvíce překvapený, Samsung je nejstabilnější, ale vysoký hrubý zisk je odsouzen k neudržitelnosti, jakmile AI CapEx mírně zpomalí nebo spotřeba technologií klesne, obrátení cyklu přijde rychleji a drasticky, než se očekává na trhu.
V tomto novém růstovém cyklu si pojďme shlédnout, jak se dva oligarchové dnes zvedli z předchozího cyklu a pokračovali ve vývoji až do současnosti:
V 80. letech lze vzestup Samsungu v oblasti DRAM označit za nejklasičtější příběh o "pozdním protiútoku" v historii polovodičů.
V té době byl globální trh s DRAM v podstatě monopolizován Spojenými státy a Japonskem: Spojené státy měly průkopníky jako Intel a Micron, Japonsko mělo giganty jako NEC, Toshiba, Hitachi, Fujitsu atd., a do poloviny 80. let Japonsko ovládalo téměř 80 % globálního trhu s DRAM.
V té době byl Samsung jen korejský chaebol prodávající elektroniku, televize a ledničky a polovodičový byznys teprve začínal. V roce 1983 se Lee Byung-cheol (zakladatel Samsungu) rozhodl vstoupit do polovodičů a výrazně investoval do výstavby továren, přičemž prvním produktem byla 64K DRAM – což byla tehdy již běžná kapacita, ale technologie Samsungu v podstatě spoléhala na licencování, reverzní inženýrství a pytláctví (včetně know-how získaných od Micronu ve Spojených státech a japonských společnostech).
V letech 1983 až 1986, po sériové výrobě 64K a následné 256K DRAM, byl trh na nízkém bodě (cena klesla z několika dolarů na desítky centů), ale výrobní náklady byly vysoké (Samsung 64K stál v jednu chvíli 1,3 dolaru za kus) a společnost utrpěla obrovské ztráty několik po sobě jdoucích let. Na konci roku 1986 Samsung Semiconductor přišel o celkovou ztrátu 300 milionů dolarů a jeho vlastní kapitál byl téměř vyčerpán a na pokraji bankrotu.
V polovině 80. let explodovala obchodní válka mezi USA a Japonskem + japonská dohoda o omezení výroby + poptávka po PC, což vytvořilo "jednou za 40 let" okno pro extrémní nedostatky a cenové nárůsty v historii DRAM. Samsung se spoléhal na národní sílu Jižní Koreje, proticyklickou horečnost k rozšíření výroby, zaplnění tržní mezery ztracené Japonskem a protiútoku malého technického následovníka, aby se během pouhých 7–8 let stal globálním hegemonem pamětí, čímž položil základy dnešního impéria polovodičů Samsung.
Tento příběh je velmi podobný současnému AI paměťovému supercyklu: strukturální nedostatek + rigidita nabídky oligopolu + exploze poptávky, což často způsobuje velkou explozi pozdních nebo stávajících hráčů, ale zároveň je doprovázeno rizikem obrovských ztrát a ostrým nedostatkem obrácení cyklu. Proto vzhledem k čínskému trhu s AI a poptávce po výpočetních tokenech exportovaných do zahraničí a podobně, možná má řeka Jang-c'-ťiang v Changxinu šanci stát se velkým vítězem díky spoléhání na tento cyklus!

687
Sakra, tým RunAnywhereAI @sanchitmonga22 přišel s MetalRT za 48 hodin, přímo posunul dekódovací rychlost LLM na Apple Silicon na novou úroveň, použil stejný 4bitový model na M4 Max, Qwen3-0,6B běží na 658 tok/s, LFM 2,5-1,2B 570 tok/s a první token trvá jen 6,6 ms.
Ve srovnání se stejným dokumentem je Apple vlastní MLX 19 %, průměr hammer llama.cpp 67 %, nemluvě o Uzu a Ollamě, které zaostávají ve všech ohledech.
Apple Intelligence od Applu vždy hlásal lokální prioritu, ale hardwarový potenciál je ve skutečnosti promarněn různými omezeními frameworku, což je ekvivalent uzavření, MetalRT má přímo útočit na Metal API, odříznout složitou režijní instalaci Python a abstrakční vrstvy a přizpůsobit ji pro sjednocenou paměť + GPU, aby vytlačil tuto vlnu extrémního výkonu.
Skutečná hodnota lokálního modelu nikdy není "jen běž, pokud můžeš", ale běží dostatečně rychle, úsporně a dostatečně soukromě, aby skutečně nahradil cloud. 6,6 ms první token znamená, že chat, hlas, kód doplněk a agent volají JSON bez prodlení; Vysoký tok/s může rozšířit kontext, multitoolový paralelismus a vyhnout se rušení. Ve spojení s nulovou sítí, nulovým odběratelem a daty nikdy neopouštějící zařízení by takto měla vypadat lokální AI na úrovni produktivity.
Rychlejší není proto, aby se předváděl tok/s, ale aby malý model přímo překonal zážitek z odezvy cloudového velkého modelu na zařízeních Apple. Apple AI na zařízení by měla být takto hraná a teď se opravdu začala zrychlovat. Apple opravdu sedí doma, open source komunita buduje otevření Pandoriny skříňky, lokální AI je příliš pohodlná, jen doufám, že se objeví více inteligentních modelů.

1,16K
Top
Hodnocení
Oblíbené
