Інженер OpenAI Клайв Чан Оскаржує Рекомендації щодо Апаратного Забезпечення V4, Посилаючись на Помилки та Невизначеність Порівняно з V3

Повідомлення Gate News, 24 квітня — інженер OpenAI Клайв Чан висунув детальні заперечення до розділу з рекомендаціями щодо апаратного забезпечення у технічному звіті V4, назвавши його “дивовижно посереднім і таким, що схильний до помилок” порівняно з відомою версією V3. Апаратні рекомендації V3, які включали сесії Q&A, що стали найпопулярнішою темою для обговорення на академічній конференції ISCA, пропонували конкретні рекомендації, узгоджені з галузевими стандартами інтерконекту. Натомість V4 є значно більш невизначеним.

Чан системно оскаржив три ключові рекомендації. Щодо споживання електроенергії, у звіті стверджується, що оптимізація програмного забезпечення дозволяє чипам одночасно працювати на повну потужність для обчислень, зберігання та зв’язку, і рекомендується виробникам чипів залишати додатковий запас потужності. Чан вважає це контрпродуктивним: загальна потужність чипа обмежена фізичними обмеженнями процесу, тож резервування більшого запасу потужності лише знижує робочу частоту, зрештою зменшуючи обчислювальну продуктивність. Щодо передавання даних між GPU, у звіті пропонується модель pull — коли GPU активно отримують дані — замість моделі push, посилаючись на високу накладну вартість сповіщень у операціях push. Чан заперечує це, стверджуючи, що pull насправді повільніший і що були б кращими покращені можливості мережевих адаптерів. Однак вони можуть обговорювати різні рівні проблеми: звіт говорить про накладні витрати механізму сповіщень, тоді як Чан має на увазі саму затримку передавання.

Щодо функцій активації, у звіті рекомендується замінити SwiGLU на простіші функції, щоб зменшити обчислювальне навантаження. Чан не бачить у цьому жодної користі, зазначаючи, що Sonic MoE вже продемонстрував оптимальну продуктивність із використанням SwiGLU. Чан припускає, що DeepSeek може мати “навмисно ослабив цей розділ.”

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Чому позитивні новини для Intel спричинили різке зростання акцій Nvidia?

Інтел цього кварталу звітував: EPS 0.29 дол. США, виручка 13.6 млрд дол. США — обидва показники перевершили очікування. Драйвери оновлення в ЦОД і обчислювальному обладнанні повертаються, підкріплюючи впевненість у попиті на напівпровідники та AI. Це позитивно вплинуло на ціну акцій NVIDIA: у середині дня вона зросла приблизно на 4.9%. Ринок вважає, що попит на базову обчислювальну потужність і надалі залишається сильним, зменшуючи занепокоєння щодо «пузиря» в AI, і підтримуючи довгострокові очікування зростання NVIDIA. У обох компаній конкуренція одночасно супроводжується позитивною взаємодією між секторами.

ChainNewsAbmedia4год тому

Китай і США стикаються в протистоянні через звинувачення в дистиляції моделей і обмеження на інвестиції

Повідомлення Gate News, 24 квітня — Китай відкинув звинувачення США в тому, що його технологічні гіганти експлуатують американські технології ШІ через дистиляцію в промислових масштабах, тоді як обидві країни готуються до масштабного зіткнення через розробку ШІ та контроль інвестицій. Адміністрація Трампа готується до

GateNews6год тому

Alphabet інвестуватиме до $40 мільярда в Anthropic, посилюючи конкуренцію в сфері ШІ

Повідомлення Gate News, 24 квітня — Alphabet, материнська компанія Google, планує інвестувати до $40 мільярда в розробника ШІ Anthropic, що складається з $10 мільярда авансом і $30 мільярда в додаткове фінансування за умови досягнення певних показників ефективності. Це інвестування є продовженням попередньої частки Alphabet у Anthropic на рівні 14%

GateNews8год тому

Швейцарський регулятор FINMA попереджає, що інструмент AI Anthropic Mythos створює фінансовий ризик

Повідомлення Gate News, 24 квітня — Федеральне управління фінансового нагляду Швейцарії (FINMA) заявило, що дозвіл банкам швидко й зручно впровадити інструмент штучного інтелекту Anthropic Mythos створюватиме серйозні ризики для

GateNews8год тому

Nvidia повертає капіталізацію $5 трлн і досягає нового абсолютного рекорду за підсумками торгів

Повідомлення Gate News, 24 квітня — у п’ятницю Nvidia зросла на 4,2%, повернувши ринкову вартість понад $5 трлн і закрившись на $208 за акцію, встановивши абсолютний рекорд закриття. Одноденне ралі додало понад $200 млрд до ринкової капіталізації чипмейкера: ціна акцій досягла внутрішньоденного максимуму приблизно $5.

GateNews9год тому

DeepSeek V4 запускається з вікном контексту 1M; чипи Huawei Ascend і Cambricon досягають повної сумісності

Повідомлення Gate News, 24 квітня — DeepSeek V4-Pro і DeepSeek V4-Flash були офіційно випущені та відкрито передані в open-source 24 квітня, причому довжина контекстного опрацювання суттєво розширена з 128K до 1M, що відповідає майже 10-кратному зростанню місткості. Huawei Computing оголосила, що її продукти Ascend supernode

GateNews9год тому
Прокоментувати
0/400
Немає коментарів