DeepSeek wprowadził swój najnowszy model, DeepSeek-OCR 2, który wykorzystuje innowacyjną metodę DeepEncoder V2. Według PANews, podejście to pozwala sztucznej inteligencji na dynamiczne reorganizowanie komponentów obrazu w oparciu o ich znaczenie, a nie tylko skanowanie od lewej do prawej. Ta technika naśladuje logiczny proces, który ludzie stosują podczas obserwacji scen. Model wykazuje doskonałą wydajność w obsłudze złożonych obrazów, takich jak dokumenty czy wykresy, w porównaniu do tradycyjnych modeli wizualno-językowych, osiągając bardziej inteligentne i przyczynowo-wnioskowe zrozumienie wizualne.