Оптимизация соответствия ключевых слов (часть 0) - проблемы и идеи - Код мира

Оптимизация соответствия ключевых слов (часть 0) - проблемы и идеи

другое 2020-04-11 23:48:00 Время чтения: null

Я столкнулся с требованием в моей работе регулировать конкретный словарный запас людей, вероятно, существует более 100 слов. Аналогично следующей ситуации (ключевые слова сложнее, чем названия мест)

Это было обработано, если еще раньше, псевдокод выглядит следующим образом:

string TempStr;
if(TempStr.Contains("海淀") && TempStr.Contains("北京") )
{
    return "北京市海淀区";
}
else if(TempStr.Contains("山东") && TempStr.Contains("威海") )
{
    return "山东省威海市";
}
……//等等一共两百多个else，内容也比较复杂，甚至还有正则匹配之类的
else
{
    return "匹配失败";
}

Поскольку моя работа состоит в том, чтобы написать плагин для Excel, это больше, чем сто, если это также влияет на эффективность работы, и это также очень неудобно поддерживать и трудно добавлять словарный запас.

В последние два дня я нашел некоторые полезные знания и планирую оптимизировать эту часть.Я использую метод tf-idf в nlp для вычисления сходства ключевых слов.

Весь процесс примерно такой: создание таблицы сопоставления ключевых слов в базе данных, чтение ее в виде словаря при запуске плагина, вычисление сходства и загрузка его в таблицу сопоставления, если запрос недоступен во время использования.

рекомендация

отwww.cnblogs.com/hewish/p/12682880.html

От 0 до начала обучения программированию, мы оставляем за какой менталитет?

вю вход 0 небольшой демо (точку монтирования, шаблоны, примеры)

Расчет геометрических шаблонов (0): Последовательность

Машинное обучение (0) - Схема

+0 акции торговых стратегий

Как недавний градиент и без опыта проекта или 0 на основе того, как люди из Департамента

Числа, начинающиеся с 0 отформатирован в фиксированной длины строки

В одномерном массиве в левом цикле все элементы р (0 <р <п) позиций

Как реагировать на создание проекта от 0

Элементы добавляются маржа: 0 авто; не вступит в силу

Ноль относительно последовательности движения данных ненулевых элементов массив НУМСА, функция записи будет все перемещения к концу массива 0, сохраняя при этом

_ Скрипт для удаления каталога для размера файла 0

0 в начале бесконечных чисел регулярного

Что такое массив? Случайный характер доступа принципа? Почему индекс массива начинается с 0?

0 Ом

0 Больших Данные изучения основного маршрута и этап обучения рекомендуемых книг

Как компьютер эволюционировали от 0

линукс корень внезапно заполнены все доступное пространство 0

Препараты упражнения 0

Чтобы удалить элемент массива 0

В соответствии с правилами сайта [0], текущая страница [страница / индекс / индекс] будет индексироваться

[Включить] делать ... в то время как (0) Магические программистам делать вещи ежедневно еженедельно ежемесячно ежегодно

Разность & а [0] и & а является

(* (Недействительный (*) ()) 0) ();

Структура данных - массив, одноцепочечный и внедрение двойной цепи и дважды связанный линейный список представляет собой линейную структуру, он имеет тот же тип п (п ≧ 0) конечная последовательность элементов данных.

Почему улей данные таблицы, но отсчет (*) возвращает 0

Научная деятельность «Знать 0» (число)

<Если тест = «тип ==„0“»> Анализируя эту проблему не пошел

Глава 0 резюме

Выродки время, чтобы начать обучение с больших объемов данных 0

рекомендация

ранжирование

win10系统mysql5.7版本下载以及安装

Red Hat отказывается от LibreOffice: RHEL больше не будет включать его в будущем

Git fusiona un solo archivo en una rama específica

2022 CSS 水平垂直居中方式汇总，全到没朋友（锤爆面试官系列）

Untiy3D найти дубликаты ресурсов

[h5] Отсканируйте QR-код, чтобы открыть приложение, или нажмите, чтобы загрузить функцию

网络安全人才发展路线图

对抗去偏+分部+正交: FairRec: Fairness-aware News Recommendation with Decomposed Adversarial Learning

Просмотр базы SqlServer, файлы добавить данные

Эти вещи о vue (3)

файл

более

2024-05-30(0)

2024-05-29(1)

2024-05-28(0)

2024-05-27(1)

2024-05-26(0)

2024-05-25(1)

2024-05-24(13)

2024-05-23(33)

2024-05-22(10)

2024-05-21(35)