Насколько хорош поиск людей с ИИ в 2026 году? Мы создали открытый бенчмарк, чтобы выяснить это. 119 реальных запросов, взятых из реальных рабочих процессов специалистов по рекрутингу, продажам и исследованиям — протестированы на четырех платформах: Lessie, Exa, Claude Code и Juicebox. Каждый результат был независимо проверен по живым веб-источникам. Никаких самоотчетных данных. Никаких подобранных вручную примеров. Этот бенчмарк по поиску людей с ИИ демонстрирует реальную эффективность.
Результат: Lessie набрала 65.2 балла в общем зачете, лидируя во всех четырех категориях сценариев. Следующая ближайшая платформа набрала 55 баллов. В этом посте мы рассмотрим полные результаты бенчмарка — что мы измеряли, как мы оценивали и что данные показывают о состоянии поиска людей с ИИ.
Почему это важно для поиска людей с ИИ
Поиск людей с ИИ становится основной инфраструктурой для команд по рекрутингу, продажам и исследованиям. Но до сих пор не было стандартизированного способа сравнения платформ. Поставщики самостоятельно сообщают данные о точности, которые невозможно проверить. Тематические исследования выбирают лучшие результаты. Этот бенчмарк меняет это — 119 реальных запросов, независимая веб-верификация и равные условия для каждой тестируемой платформы в области поиска людей с ИИ.
Сравнение платформ для поиска людей с ИИ
119 реальных запросов, независимо оцененных с помощью веб-верификации по шкале от 0 – 100. Каждая платформа выполняла одни и те же запросы в идентичных условиях. Оценки усредняются по трем параметрам: Релевантность, Покрытие и Полезность. Это позволяет объективно оценить поиск людей с ИИ.

Общие баллы: Lessie 65.2 | Exa 55 | Claude Code 46 | Juicebox 45.8. Общий балл является простым средним арифметическим Релевантности, Покрытия и Полезности— каждый из которых измеряется независимо по шкале от 0 – 100. Это ключевые показатели для поиска людей с ИИ.
Разбивая по параметрам: Lessie лидировала по Релевантности (70.2 против 54.3 для следующей лучшей), Покрытию (69.1 против 58.1) и Полезности (56.4 против 53.1). Самый большой разрыв был в Релевантности — преимущество +29% над ближайшим конкурентом — что означает, что Lessie постоянно возвращала нужных людей, правильно ранжированных, по различным типам запросов в поиске людей с ИИ.
Производительность по сценариям поиска людей с ИИ
Бенчмарк охватывает четыре реальных сценария использования, где поиск людей с ИИ создает бизнес-ценность. Каждый сценарий отражает отдельный рабочий процесс: разные источники данных, разная сложность критериев и разные определения “хорошего” результата.

Инфлюенсер / KOL: Lessie 62.3 | Claude Code 43.2 | Exa 41.6 | Juicebox 31.1. Это был самый большой разрыв в производительности во всем бенчмарке. Платформы с одним источником данных испытывают здесь наибольшие трудности, потому что инфлюенсеры существуют на фрагментированных социальных платформах — Instagram, TikTok, YouTube, Twitter, подкасты, рассылки— и ни одна база данных не охватывает их всех. Lessie превосходит в поиске людей с ИИ для инфлюенсеров.
Экспертный / Детерминированный: Lessie 70.4 | Exa 61.2 | Claude Code 57 | Juicebox 44.2. Эти запросы имеют проверяемые правильные ответы или ищут конкретных экспертов в области. Гибридная стратегия поиска Lessie — сочетание структурированных баз данных с живым веб-исследованием — оказалась наиболее эффективной для поиска нужных людей. Оптимизированный поиск людей с ИИ.
B2B-проспектинг: Lessie 60.6 | Exa 55.2 | Juicebox 51.4 | Claude Code 43. Поиск лиц, принимающих решения в целевых компаниях, является наиболее распространенным сценарием использования поиска людей с ИИ. Преимущество Lessie заключается в перекрестной проверке нескольких источников данных для проверки текущих ролей и контактной информации.
Рекрутинг: Lessie 68.2 | Juicebox 65.7 | Exa 64.7 | Claude Code 50.5. Это был самый конкурентный сценарий — три платформы набрали более 64 баллов в общем зачете. Рекрутинговые запросы выигрывают от баз данных, ориентированных на LinkedIn, к которым имеют доступ все платформы. Разница здесь самая тонкая в бенчмарке для поиска людей с ИИ.
Глубокий анализ сценариев
Каждый балл сценария разбивается на три независимых параметра: Релевантность (нашли ли вы нужных людей?), Покрытие (сколько квалифицированных результатов?) и Полезность (являются ли возвращенные данные действенными?). Вот подробная разбивка для поиска людей с ИИ.
Инфлюенсер / KOL — Поиск создателей контента на социальных платформах
- Lessie: Релевантность 65.2, Покрытие 62.8, Полезность 58.9 — 100% коэффициент завершения
- Exa: 89.7% от производительности Lessie
- Claude Code: 82.8% от производительности Lessie
- Juicebox: 79.3% от производительности Lessie
Экспертный / Детерминированный — Запросы с проверяемыми ответами или конкретными экспертами в области
- Lessie: Релевантность 79, Покрытие 75.2, Полезность 57.1 — 100% коэффициент завершения
- Exa: 96.4% от производительности Lessie
- Claude Code: 100% коэффициент завершения, но более низкие общие баллы
- Juicebox: 71.4% от производительности Lessie
B2B-проспектинг — Поиск лиц, принимающих решения в целевых компаниях
- Lessie: Релевантность 62.8, Покрытие 63.5, Полезность 55.5 — 100% коэффициент завершения
- Exa: 100% коэффициент завершения, близко по Покрытию
- Juicebox: 84.4% от производительности Lessie
- Claude Code: 75% коэффициент завершения — самый низкий в этой категории
Рекрутинг — Поиск кандидатов с определенными навыками, опытом и местоположением
- Lessie: Релевантность 74.8, Покрытие 75.6, Полезность 54.3 — 100% коэффициент завершения
- Exa, Juicebox: оба 100% коэффициент завершения
- Claude Code: 90% коэффициент завершения
- Рекрутинг имел самые высокие абсолютные баллы среди всех платформ — это наиболее зрелый вариант использования для поиска людей с ИИ
Набор данных для оценки
Бенчмарк использует 119 запросов, отобранных из реальных рабочих процессов специалистов по рекрутингу, продажам и исследованиям. Это не синтетические тестовые случаи — они отражают реальные поиски, которые выполняют профессионалы при поиске людей. Набор данных является многоязычным (английский, португальский, испанский, голландский) и ориентированным на практику. Это важно для эффективного поиска людей с ИИ.
- Рекрутинг (30 запросов): Поиск кандидатов с определенными навыками, уровнями опыта и местоположением
- B2B-проспектинг (32 запроса): Выявление лиц, принимающих решения в целевых компаниях для продаж
- Экспертный / Детерминированный (28 запросов): Запросы с проверяемыми правильными ответами или поиск конкретных экспертов в области
- Инфлюенсер / KOL (29 запросов): Поиск создателей контента на социальных платформах по нише, аудитории и вовлеченности
Три параметра оценки измеряют независимые аспекты качества поиска: Релевантность (качество ранжирования), Покрытие (объем результатов) и Полезность (полнота данных). Они объединяются в общий балл. Все это критично для поиска людей с ИИ.
Методология
Конвейер оценки полностью автоматизирован и воспроизводим. Каждый результат с каждой платформы проверяется по живым веб-источникам — никаких самоотчетных данных, никакой ручной курации. Это обеспечивает объективность оценки поиска людей с ИИ.
Шаг 1: Декомпозиция запроса. Запрос, такой как “Старший ML-инженер в стартапе серии B в Берлине”, становится структурированным контрольным списком: роль, стаж, область, стадия компании, местоположение. Эта декомпозиция определяет критерии оценки для каждого результата. Это основа для точного поиска людей с ИИ.
Шаг 2: Проверка по Вебу. Каждый человек, возвращенный каждой платформой, проверяется по LinkedIn, веб-сайтам компаний и социальным профилям. Никаких самоотчетных данных— только то, что может быть независимо подтверждено онлайн. Это устраняет предвзятость платформы и обеспечивает справедливое сравнение для поиска людей с ИИ.
Шаг 3: Оценка по трем осям. Релевантность (нашли ли вы нужных людей?), Покрытие (сколько?) и Полезность (действительно ли данные профиля полезны?). Эти три оценки объединяются в одну общую оценку: (Релевантность + Покрытие + Полезность) / 3. Так оценивается качество поиска людей с ИИ.
Что мы измеряем
Релевантность — Padded nDCG@10. Измеряет, соответствуют ли возвращенные люди запросу и правильно ли они ранжированы. Каждый человек проверяется по вебу и оценивается по четким критериям. Оценка заполняется до 10 слотов — возвращение меньшего количества результатов наказывается. Это вознаграждает как точность, так и полноту в верхних результатах. Важный аспект для поиска людей с ИИ.
Покрытие — TCR × Yield. Измеряет, сколько квалифицированных людей найдено по каждому запросу. Объединяет коэффициент завершения задачи (вернула ли платформа хоть какие-то результаты?) со средним выходом квалифицированных результатов, ограниченным K=10. Это вознаграждает как надежность, так и объем релевантных результатов для поиска людей с ИИ.
Полезность — (C + E + A) / 3. Измеряет, являются ли возвращенные данные полными и действенными. Усредняет три подпараметра: структурную полноту (C), доказательства, специфичные для запроса (E), и действенность (A). Профиль с именем, но без электронной почты, должности или компании получает низкую оценку по Полезности, даже если человек релевантен. Это критично для практического поиска людей с ИИ.
Ключевые выводы
После 476 запусков платформы по 119 запросам выявилось несколько закономерностей, которые показывают, где находится поиск людей с ИИ сегодня и где каждая платформа преуспевает или терпит неудачу.
- #1 во всех четырех сценариях. Lessie — единственная платформа, лидирующая в каждой категории — Рекрутинг, B2B-проспектинг, Экспертный / Детерминированный и Инфлюенсер / KOL. Ни одна другая платформа не занимала первое место более чем в одном сценарии. Это подтверждает лидерство Lessie в поиске людей с ИИ.
- 100% коэффициент завершения. Каждый запрос возвращал результаты. Ни одна другая платформа не достигла этого — особенно в нишевых и абстрактных поисках, где другие ничего не возвращали. Возвращение нулевых результатов является режимом отказа, уникальным для платформ с одним источником данных. Lessie обеспечивает полный поиск людей с ИИ.
- Самый большой разрыв в релевантности: 70.2 против 54.3 (+29%). Разница в качестве ранжирования наиболее выражена в запросах с несколькими критериями — поисках, которые объединяют ограничения по роли, стажу, отрасли и местоположению. Это показывает превосходство Lessie в поиске людей с ИИ.
- Инфлюенсер — самый большой разрыв. Lessie набрала 62.3 балла в общем зачете; ближайший конкурент набрал 43.2. Платформы с одним источником данных испытывают здесь наибольшие трудности, потому что данные об инфлюенсерах фрагментированы по десяткам социальных платформ. Lessie лидирует в поиске людей с ИИ для инфлюенсеров.
- Полезность — самая близкая гонка. Полнота данных профиля является наиболее конкурентным параметром — все платформы набрали от 42.7 до 56.4. Именно здесь у отрасли есть наибольшее пространство для улучшения качества поиска людей с ИИ.
- Рекрутинг — самый конкурентный. Три платформы набрали более 64 баллов в общем зачете. Это сценарий, где существующие инструменты работают лучше всего — и где разница самая тонкая. Данные, ориентированные на LinkedIn, дают всем платформам более сильную базовую линию здесь для поиска людей с ИИ.
Открытый исходный код: Полный набор данных для оценки, методология оценки и результаты на уровне платформы доступны для ознакомления. Мы считаем, что прозрачные бенчмарки продвигают всю отрасль вперед, особенно в области поиска людей с ИИ.