Поиск людей с ИИ: Lessie #1 в бенчмарке по 119 запросам

119Реальных запросов

4Категории сценариев

#1Общий рейтинг

100%Коэффициент завершения

Насколько хорош поиск людей с ИИ в 2026 году? Мы создали открытый бенчмарк, чтобы выяснить это. 119 реальных запросов, взятых из реальных рабочих процессов специалистов по рекрутингу, продажам и исследованиям — протестированы на четырех платформах: Lessie, Exa, Claude Code и Juicebox. Каждый результат был независимо проверен по живым веб-источникам. Никаких самоотчетных данных. Никаких подобранных вручную примеров. Этот бенчмарк по поиску людей с ИИ демонстрирует реальную эффективность.

Результат: Lessie набрала 65.2 балла в общем зачете, лидируя во всех четырех категориях сценариев. Следующая ближайшая платформа набрала 55 баллов. В этом посте мы рассмотрим полные результаты бенчмарка — что мы измеряли, как мы оценивали и что данные показывают о состоянии поиска людей с ИИ.

Почему это важно для поиска людей с ИИ

Поиск людей с ИИ становится основной инфраструктурой для команд по рекрутингу, продажам и исследованиям. Но до сих пор не было стандартизированного способа сравнения платформ. Поставщики самостоятельно сообщают данные о точности, которые невозможно проверить. Тематические исследования выбирают лучшие результаты. Этот бенчмарк меняет это — 119 реальных запросов, независимая веб-верификация и равные условия для каждой тестируемой платформы в области поиска людей с ИИ.

Сравнение платформ для поиска людей с ИИ

119 реальных запросов, независимо оцененных с помощью веб-верификации по шкале от 0 – 100. Каждая платформа выполняла одни и те же запросы в идентичных условиях. Оценки усредняются по трем параметрам: Релевантность, Покрытие и Полезность. Это позволяет объективно оценить поиск людей с ИИ.

Диаграмма сравнения платформ, показывающая Lessie с 65.2 баллами в общем зачете, Exa с 55, Claude Code с 46 и Juicebox с 45.8 по параметрам Общий, Релевантность, Покрытие и Полезность

Общие баллы: Lessie 65.2 | Exa 55 | Claude Code 46 | Juicebox 45.8. Общий балл является простым средним арифметическим Релевантности, Покрытия и Полезности— каждый из которых измеряется независимо по шкале от 0 – 100. Это ключевые показатели для поиска людей с ИИ.

Разбивая по параметрам: Lessie лидировала по Релевантности (70.2 против 54.3 для следующей лучшей), Покрытию (69.1 против 58.1) и Полезности (56.4 против 53.1). Самый большой разрыв был в Релевантности — преимущество +29% над ближайшим конкурентом — что означает, что Lessie постоянно возвращала нужных людей, правильно ранжированных, по различным типам запросов в поиске людей с ИИ.

Производительность по сценариям поиска людей с ИИ

Бенчмарк охватывает четыре реальных сценария использования, где поиск людей с ИИ создает бизнес-ценность. Каждый сценарий отражает отдельный рабочий процесс: разные источники данных, разная сложность критериев и разные определения “хорошего” результата.

Горизонтальная гистограмма, показывающая, что Lessie лидирует во всех четырех сценариях: Инфлюенсер/KOL 62.3, Экспертный/Детерминированный 70.4, B2B-проспектинг 60.6, Рекрутинг 68.2

Инфлюенсер / KOL: Lessie 62.3 | Claude Code 43.2 | Exa 41.6 | Juicebox 31.1. Это был самый большой разрыв в производительности во всем бенчмарке. Платформы с одним источником данных испытывают здесь наибольшие трудности, потому что инфлюенсеры существуют на фрагментированных социальных платформах — Instagram, TikTok, YouTube, Twitter, подкасты, рассылки— и ни одна база данных не охватывает их всех. Lessie превосходит в поиске людей с ИИ для инфлюенсеров.

Экспертный / Детерминированный: Lessie 70.4 | Exa 61.2 | Claude Code 57 | Juicebox 44.2. Эти запросы имеют проверяемые правильные ответы или ищут конкретных экспертов в области. Гибридная стратегия поиска Lessie — сочетание структурированных баз данных с живым веб-исследованием — оказалась наиболее эффективной для поиска нужных людей. Оптимизированный поиск людей с ИИ.

B2B-проспектинг: Lessie 60.6 | Exa 55.2 | Juicebox 51.4 | Claude Code 43. Поиск лиц, принимающих решения в целевых компаниях, является наиболее распространенным сценарием использования поиска людей с ИИ. Преимущество Lessie заключается в перекрестной проверке нескольких источников данных для проверки текущих ролей и контактной информации.

Рекрутинг: Lessie 68.2 | Juicebox 65.7 | Exa 64.7 | Claude Code 50.5. Это был самый конкурентный сценарий — три платформы набрали более 64 баллов в общем зачете. Рекрутинговые запросы выигрывают от баз данных, ориентированных на LinkedIn, к которым имеют доступ все платформы. Разница здесь самая тонкая в бенчмарке для поиска людей с ИИ.

Глубокий анализ сценариев

Каждый балл сценария разбивается на три независимых параметра: Релевантность (нашли ли вы нужных людей?), Покрытие (сколько квалифицированных результатов?) и Полезность (являются ли возвращенные данные действенными?). Вот подробная разбивка для поиска людей с ИИ.

Инфлюенсер / KOL — Поиск создателей контента на социальных платформах

Lessie: Релевантность 65.2, Покрытие 62.8, Полезность 58.9 — 100% коэффициент завершения
Exa: 89.7% от производительности Lessie
Claude Code: 82.8% от производительности Lessie
Juicebox: 79.3% от производительности Lessie

Экспертный / Детерминированный — Запросы с проверяемыми ответами или конкретными экспертами в области

Lessie: Релевантность 79, Покрытие 75.2, Полезность 57.1 — 100% коэффициент завершения
Exa: 96.4% от производительности Lessie
Claude Code: 100% коэффициент завершения, но более низкие общие баллы
Juicebox: 71.4% от производительности Lessie

B2B-проспектинг — Поиск лиц, принимающих решения в целевых компаниях

Lessie: Релевантность 62.8, Покрытие 63.5, Полезность 55.5 — 100% коэффициент завершения
Exa: 100% коэффициент завершения, близко по Покрытию
Juicebox: 84.4% от производительности Lessie
Claude Code: 75% коэффициент завершения — самый низкий в этой категории

Рекрутинг — Поиск кандидатов с определенными навыками, опытом и местоположением

Lessie: Релевантность 74.8, Покрытие 75.6, Полезность 54.3 — 100% коэффициент завершения
Exa, Juicebox: оба 100% коэффициент завершения
Claude Code: 90% коэффициент завершения
Рекрутинг имел самые высокие абсолютные баллы среди всех платформ — это наиболее зрелый вариант использования для поиска людей с ИИ

Набор данных для оценки

Бенчмарк использует 119 запросов, отобранных из реальных рабочих процессов специалистов по рекрутингу, продажам и исследованиям. Это не синтетические тестовые случаи — они отражают реальные поиски, которые выполняют профессионалы при поиске людей. Набор данных является многоязычным (английский, португальский, испанский, голландский) и ориентированным на практику. Это важно для эффективного поиска людей с ИИ.

Рекрутинг (30 запросов): Поиск кандидатов с определенными навыками, уровнями опыта и местоположением
B2B-проспектинг (32 запроса): Выявление лиц, принимающих решения в целевых компаниях для продаж
Экспертный / Детерминированный (28 запросов): Запросы с проверяемыми правильными ответами или поиск конкретных экспертов в области
Инфлюенсер / KOL (29 запросов): Поиск создателей контента на социальных платформах по нише, аудитории и вовлеченности

Три параметра оценки измеряют независимые аспекты качества поиска: Релевантность (качество ранжирования), Покрытие (объем результатов) и Полезность (полнота данных). Они объединяются в общий балл. Все это критично для поиска людей с ИИ.

Методология

Конвейер оценки полностью автоматизирован и воспроизводим. Каждый результат с каждой платформы проверяется по живым веб-источникам — никаких самоотчетных данных, никакой ручной курации. Это обеспечивает объективность оценки поиска людей с ИИ.

Шаг 1: Декомпозиция запроса. Запрос, такой как “Старший ML-инженер в стартапе серии B в Берлине”, становится структурированным контрольным списком: роль, стаж, область, стадия компании, местоположение. Эта декомпозиция определяет критерии оценки для каждого результата. Это основа для точного поиска людей с ИИ.

Шаг 2: Проверка по Вебу. Каждый человек, возвращенный каждой платформой, проверяется по LinkedIn, веб-сайтам компаний и социальным профилям. Никаких самоотчетных данных— только то, что может быть независимо подтверждено онлайн. Это устраняет предвзятость платформы и обеспечивает справедливое сравнение для поиска людей с ИИ.

Шаг 3: Оценка по трем осям. Релевантность (нашли ли вы нужных людей?), Покрытие (сколько?) и Полезность (действительно ли данные профиля полезны?). Эти три оценки объединяются в одну общую оценку: (Релевантность + Покрытие + Полезность) / 3. Так оценивается качество поиска людей с ИИ.

Что мы измеряем

Релевантность — Padded nDCG@10. Измеряет, соответствуют ли возвращенные люди запросу и правильно ли они ранжированы. Каждый человек проверяется по вебу и оценивается по четким критериям. Оценка заполняется до 10 слотов — возвращение меньшего количества результатов наказывается. Это вознаграждает как точность, так и полноту в верхних результатах. Важный аспект для поиска людей с ИИ.

Покрытие — TCR × Yield. Измеряет, сколько квалифицированных людей найдено по каждому запросу. Объединяет коэффициент завершения задачи (вернула ли платформа хоть какие-то результаты?) со средним выходом квалифицированных результатов, ограниченным K=10. Это вознаграждает как надежность, так и объем релевантных результатов для поиска людей с ИИ.

Полезность — (C + E + A) / 3. Измеряет, являются ли возвращенные данные полными и действенными. Усредняет три подпараметра: структурную полноту (C), доказательства, специфичные для запроса (E), и действенность (A). Профиль с именем, но без электронной почты, должности или компании получает низкую оценку по Полезности, даже если человек релевантен. Это критично для практического поиска людей с ИИ.

Ключевые выводы

После 476 запусков платформы по 119 запросам выявилось несколько закономерностей, которые показывают, где находится поиск людей с ИИ сегодня и где каждая платформа преуспевает или терпит неудачу.

#1 во всех четырех сценариях. Lessie — единственная платформа, лидирующая в каждой категории — Рекрутинг, B2B-проспектинг, Экспертный / Детерминированный и Инфлюенсер / KOL. Ни одна другая платформа не занимала первое место более чем в одном сценарии. Это подтверждает лидерство Lessie в поиске людей с ИИ.
100% коэффициент завершения. Каждый запрос возвращал результаты. Ни одна другая платформа не достигла этого — особенно в нишевых и абстрактных поисках, где другие ничего не возвращали. Возвращение нулевых результатов является режимом отказа, уникальным для платформ с одним источником данных. Lessie обеспечивает полный поиск людей с ИИ.
Самый большой разрыв в релевантности: 70.2 против 54.3 (+29%). Разница в качестве ранжирования наиболее выражена в запросах с несколькими критериями — поисках, которые объединяют ограничения по роли, стажу, отрасли и местоположению. Это показывает превосходство Lessie в поиске людей с ИИ.
Инфлюенсер — самый большой разрыв. Lessie набрала 62.3 балла в общем зачете; ближайший конкурент набрал 43.2. Платформы с одним источником данных испытывают здесь наибольшие трудности, потому что данные об инфлюенсерах фрагментированы по десяткам социальных платформ. Lessie лидирует в поиске людей с ИИ для инфлюенсеров.
Полезность — самая близкая гонка. Полнота данных профиля является наиболее конкурентным параметром — все платформы набрали от 42.7 до 56.4. Именно здесь у отрасли есть наибольшее пространство для улучшения качества поиска людей с ИИ.
Рекрутинг — самый конкурентный. Три платформы набрали более 64 баллов в общем зачете. Это сценарий, где существующие инструменты работают лучше всего — и где разница самая тонкая. Данные, ориентированные на LinkedIn, дают всем платформам более сильную базовую линию здесь для поиска людей с ИИ.

Открытый исходный код: Полный набор данных для оценки, методология оценки и результаты на уровне платформы доступны для ознакомления. Мы считаем, что прозрачные бенчмарки продвигают всю отрасль вперед, особенно в области поиска людей с ИИ.

FAQ

Что такое бенчмарк поиска людей с ИИ?

Бенчмарк поиска людей с ИИ — это стандартизированная оценка, которая проверяет, насколько хорошо различные платформы находят и возвращают информацию о людях. Этот бенчмарк использует 119 реальных запросов по рекрутингу, B2B-проспектингу, поиску экспертов и обнаружению инфлюенсеров — оцениваемых по Релевантности, Покрытию и Полезности посредством независимой веб-верификации.

Как Lessie сравнивается с Exa, Claude Code и Juicebox в поиске людей с ИИ?

Lessie набрала 65.2 балла в общем зачете, по сравнению с Exa (55), Claude Code (46) и Juicebox (45.8). Lessie лидировала во всех четырех категориях сценариев и достигла 100% коэффициента завершения запросов. Самый большой разрыв был в Релевантности (+29% по сравнению со следующим лучшим) и поиске Инфлюенсеров / KOL (62.3 против 43.2). См. полное сравнение на странице результатов бенчмарка.

Методология бенчмарка поиска людей с ИИ является открытым исходным кодом?

Да. Конвейер оценки полностью автоматизирован и воспроизводим. Каждый результат проверяется по живым веб-источникам — LinkedIn, веб-сайтам компаний и социальным профилям. Набор данных, формулы оценки и результаты по каждому запросу доступны для независимого анализа.

Что означают Релевантность, Покрытие и Полезность в этом бенчмарке поиска людей с ИИ?

Релевантность (Padded nDCG@10) измеряет, соответствуют ли возвращенные люди запросу и правильно ли они ранжированы. Покрытие (TCR × Yield) измеряет, сколько квалифицированных результатов найдено по каждому запросу. Полезность ((C + E + A) / 3) измеряет, являются ли возвращенные данные полными и действенными — включая контактную информацию, текущую роль и данные компании.

Почему Lessie показывает лучшие результаты в сценарии Инфлюенсер / KOL для поиска людей с ИИ?

Данные об инфлюенсерах фрагментированы по Instagram, TikTok, YouTube, Twitter, подкастам и рассылкам. Платформы с одним источником данных, которые полагаются на одну базу данных, упускают большую часть этого. Гибридная стратегия поиска Lessie ищет по 100+ источникам одновременно, поэтому она набрала 62.3 балла в этом сценарии, в то время как ближайший конкурент набрал 43.2. Попробуйте сами на Lessie Influencer Discovery.

#1 в поиске людей с ИИ: Результаты бенчмарка Lessie по 119 реальным запросам