Сервис анализа PDF файлов геологических публикаций

с помощью нейросетовой языковой модели DeepSeek R1

Патук М.И. ГГМ РАН

Сервис предназначен для анализа научных публикаций геологической направленности на русском и английском языках.

Для начала работы по анализу PDF файла щелкните по кнопке "Обзор..." и выберите файл, который вы хототе проанализировать. Если вам надо проанализировать только один файл, то слева, где написано "Введите свой вопрос..." напишите примерно следующее - "Проанализируй этот файл" и нажмите кнопку "Отправить" или клавишу Enter.

Через некоторое время, ~1 мин., зависит от загрузки сервера, на экране появится ваш вопрос и ответ модели. Ответ представлен сплошным текстом, не вполне удобным для восприятия. Для получения ответа в структурированном виде, нажмите на кнопку "Просмотр результата". Откроется отдельное окно со структурированным ответом.

Кнопка в виде наложенных квадратов (внизу справа) позволяет скопировать полученный ответ и вставить его, например, в Word. Кнопка "Назад" возвращает вас на исходную страницу сервиса. Кнопка "Назад 1 шаг" возвращает вас на предыдущую страницу сервиса.

Если вам надо проанализировать и сравнить несколько файлов, то после выбора первого файла можно написать как "Проанализируй этот файл", так и "Запомни этот файл". После получения ответа от системы открываете следующий файл и пишите "Запомни второй файл" или "Проанализируй второй файл". Важно указывать нумерацию файлов, чтобы иметь возможность, в дальнейшем, задавать вопросы по конкретным файлам. В зависимости от введенного вопроса система либо предоставит анализ второго файла, либо выдаст описание схожести и различия двух файлов.

Описанным выше способом можно загружать до 5 файлов среднего размера (около 10 страниц) для их совместного анализа. Также можно задавать различные вопросы по загруженным файлам.

Если загружаемый файл слишком большой, то сервис постарается его обрезать путем отсечения конца файла. При загрузке следующего файла в этой ситуации возможно возникновение ошибки и модель сообщит о превышении размеров контекстного окна.

Существуют PDF файлы, из которых невозможно извлечь текстовые данные. В этом случае система ответит - "Этот PDF файл не может быть обработан!"