Разное Январь 28, 2025
Meta в панике! Они создали четыре "ситуационные комнаты" (да, как в шпионских фильмах), чтобы разгадать феномен стартапа DeepSeek, который неожиданно уделал всех в гонке искусственного интеллекта.
Что случилось? DeepSeek запустили свою новую модель — DeepSeek V3. С виду обычный «ИИ-зверь», но тут сюрприз: 671 миллиард параметров, два месяца на обучение и всего 5,58 миллионов долларов бюджета. Для сравнения, Meta и OpenAI обычно жгут миллионы, как дрова в костре, а тут китайский стартап выкатил нечто мощное и бюджетное. В Meta явно что-то пошло не так — и это что-то DeepSeek V3.
Почему она крутая? DeepSeek использует две технологии, которые звучат как магия из будущего: Multi-token Prediction (предсказывает сразу несколько слов, а не по одному) и Mixture of Experts (модель, которая включается только там, где нужно). Результат? Меньше вычислений, меньше затрат, а скорость и качество — огонь. Эта штука может писать код, переводить тексты и даже создавать эссе, так что гуманитарии, берегитесь.
Meta ломает голову, OpenAI хлопает в ладоши, а DeepSeek не останавливается. В будущем они хотят добавить мультимодальность (чтобы понимать и картинки, и текст одновременно) и ещё больше фишек, которые сделают их конкурентами №1.
Мораль истории? Не стоит недооценивать тех, кто играет экономно. Пока гиганты соревнуются, кто потратит больше, умники из DeepSeek показали, как делать больше с меньшими затратами.