Илон Маск снова произвел фурор, когда запустил #grok3 , новейший продукт xAI в области искусственного интеллекта, намереваясь превзойти таких гигантов, как GPT-4o, Claude 3.5 Sonnet, Gemini и DeepSeek. Но насколько на самом деле силен Грок-3? Давайте сравним!

1. Композитор: Grok-3 превосходит Claude

Grok-3 преуспевает в повествовании, превосходя #Claude 3.5 Sonnet по богатому содержанию, качественным персонажам и увлекательному повествованию. Однако содержание все еще не идеально, некоторые детали сковывают читателя.

2. Краткое содержание документа: выберите в соответствии с вашими предпочтениями.

Несмотря на то, что Grok-3 не поддерживает прямое чтение документов, он по-прежнему точно резюмирует длинные документы, превосходя Клода по точности. Однако его стиль изложения разговорный и легкий для понимания, в то время как GPT-4o предлагает более глубокий анализ.

BTC
BTCUSDT
89,074.8
+0.47%

3. Модерация контента: Grok-3 менее строг

По сравнению с другими ИИ, Grok-3, по-видимому, более открыт для таких деликатных тем, как гендер, политика и насилие. Несмотря на свои ограничения, он предлагает важные ответы посредством тонких выражений.

BNB
BNB
896.16
+1.17%

4. Программирование: Grok-3 работает гладко.

При прохождении теста по кодированию Grok-3 не только сгенерировал стабильный код, но и автоматически выбрал #HTML5 вместо Python для небольшой игры, что обеспечило лучшую доступность. Результатом является прекрасный игровой интерфейс, который работает плавно и без ошибок.

5. Математика: пока не сильная сторона.

Grok-3 хорошо справился с тестом на логическое мышление, но все равно уступил OpenAI и #DeepSeek в сложных математических задачах. Несмотря на то, что он быстро выполняет вычисления, ему все еще трудно решать сложные задачи, требующие глубоких рассуждений.

6. Создание имиджа: неплохо, но не эксперт

Grok-3 использует Aurora, собственную систему генерации изображений xAI. Хотя он превосходит DALL-E 3 от OpenAI, он все еще уступает специализированным моделям, таким как MidJourney или Stable Diffusion 3.5. Однако стоит отметить скорость создания изображений, которая выше, чем у конкурентов.

USDC
USDC
1.0011
+0.02%

Вывод: Grok-3 имеет большой потенциал, особенно в создании, программировании и модерировании более открытого контента, чем другие ИИ. Однако у него все еще есть слабые стороны, такие как математика, глубокий анализ и создание изображений, которые не являются выдающимися. Хотя Grok-3 не может полностью победить GPT-4o или Claude 3.5, он по-прежнему является грозным противником и обещает значительно улучшить свои показатели в будущем».