Шлюзи відкрилися для будівництва моделей AI міркування дешево.
Дослідники Стенфорда та Університету Вашингтона розробили модель, яка виступає порівняно з моделями OpenAI O1 та DeepSeek R1 з математики та кодування – менше ніж 50 доларів за хмарними обчислювальними кредитами.
Крім того, модель пройшла навчання лише в 1000 питань і зайняла лише 26 хвилин та 16 GPU NVIDIA H100. Дослідник Стенфорда Ніклас Муеннігофф заявив, що в електронному листі з Mashable, що вартість – це оцінка на основі часу виконання GPU та кількості використовуваних графічних процесорів H100.
Зустріньте Qwen 2.5 Alibaba, модель AI, яка стверджує, що переможе як DeepSeek, так і OpenAi’s Chatgpt
Промисловість AI повільно стосується того, як нові підходи до процесу до та після навчання можуть заощадити вартість комп’ютера, про що свідчить дратівливий вплив DeepSeek. Крім того, розробники тепер можуть використовувати над існуючими моделями AI за невеликими витратами або не вартістю, через API, доступ з відкритим кодом і навіть закритим джерелом їх дистиляту даних, зменшуючи вартість навіть дорожче.
Швидко яскрава швидкість
Згідно з дослідницьким документом команди, який був опублікований минулої п’ятниці, S1 пройшов навчання в наборі даних, що складаються з “1000 ретельно вишуканих питань у поєднанні зі слідами та міркуваннями відповідей, перероблених експериментальними думками Близнюків”. Експериментальна експериментальна модель Google Google доступна щоденними обмеженнями через AI Studio. Хоча це модель закритого джерела, це чітко не заважало дослідникам використовувати його відповіді.
OpenAI запускає AI Agent для Chatgpt “Deep Research”
Потім дослідники використовували модель “поза полицею” з лабораторії Alibaba, Qwen, і зробили вдосконалення керівника своїх старанних даних. Потім команда створила бюджет контракту, щоб перевірити кількість часу обчислення для тесту на модель. Якщо S1 прийняв бюджет на думку про бренди, він був скорочений і повинен був створити будь -яку відповідь. Якби дослідники хотіли, щоб модель витрачала більше “тестування” на проблему, вони просто сказали б модель “чекати”, продовжуючи його час мислення і призвели до більш точних результатів.
Перевіряючи час та розрахунок, витрачений на проблему, дослідники змогли показати, як збільшена група мислення призводить до підвищення ефективності.
S1 – приклад моделей міркувань з відкритим кодом, розроблених для частки Google та OpenAI. У січні дослідники UC Berkeley опублікували модель міркування з відкритим кодом під назвою Sky-T1, яка коштує 450 доларів “, що підтверджує, що можливості високого рівня розумного фінансового та ефективного можуть бути відтворені”, згідно з його публікацією в блозі. Існує також модель міркувань RSTAR від дослідників Microsoft Asia, Tulu 3 з Інституту некомерційних досліджень AI2, а Huggingface має власну ініціативу відтворити R1 Deepseek.
Оскільки високоякісні моделі стають більш доступними та дешевшими, ми починаємо бачити зміну потужності від кількох важких нападників, до багатьох.
Питання
Штучний інтелект OpenAi