Хеширование строк: различия между версиями
Перейти к навигации
Перейти к поиску
Ctrlalt (обсуждение | вклад) (→Ссылки) |
Ctrlalt (обсуждение | вклад) Нет описания правки |
||
(не показана 1 промежуточная версия этого же участника) | |||
Строка 2: | Строка 2: | ||
struct Hasher { | struct Hasher { | ||
long long x | long long x, mod; | ||
vector<long long> p, h; | vector<long long> p, h; | ||
Hasher(const string &s) { | Hasher(const string &s, long long x = 31, long long mod = 1e9 + 7) : x(x), mod(mod) { | ||
p.resize(s.size()); | p.resize(s.size()); | ||
h.resize(s.size()); | h.resize(s.size()); | ||
Строка 23: | Строка 23: | ||
res = (res - p[r - l + 1] * h[l - 1] % mod + mod) % mod; | res = (res - p[r - l + 1] * h[l - 1] % mod + mod) % mod; | ||
return res; | return res; | ||
} | |||
}; | |||
struct DoubleHasher { | |||
Hasher h1, h2; | |||
DoubleHasher(const string &s) : h1(s), h2(s, 29, 1e9 + 9) {} | |||
pair<long long, long long> getHash(int l, int r) { | |||
return { h1.getHash(l, r), h2.getHash(l, r) }; | |||
} | } | ||
}; | }; |
Текущая версия от 15:33, 16 декабря 2024
hi = s0xn - 1 + s1xn - 2 + ... + sn - 2x + sn - 1.
struct Hasher { long long x, mod; vector<long long> p, h; Hasher(const string &s, long long x = 31, long long mod = 1e9 + 7) : x(x), mod(mod) { p.resize(s.size()); h.resize(s.size()); p[0] = 1; h[0] = s[0] - 'a' + 1; for (int i = 1; i < s.size(); i++) { p[i] = p[i - 1] * x % mod; h[i] = (h[i - 1] * x % mod + s[i] - 'a' + 1) % mod; } } long long getHash(int l, int r) { long long res = h[r]; if (l) res = (res - p[r - l + 1] * h[l - 1] % mod + mod) % mod; return res; } };
struct DoubleHasher { Hasher h1, h2; DoubleHasher(const string &s) : h1(s), h2(s, 29, 1e9 + 9) {} pair<long long, long long> getHash(int l, int r) { return { h1.getHash(l, r), h2.getHash(l, r) }; } };
hi = s0 + s1x + s2x2 + ... + sn - 1xn - 1. Для выравнивания хеши различных подстрок домножаются на xn - 1 - L. struct Hasher { long long x = 31, mod = 1e9 + 7; vector<long long> p, h; Hasher(const string &s) { p.resize(s.size()); h.resize(s.size()); p[0] = 1; h[0] = s[0] - 'a' + 1; for (int i = 1; i < s.size(); i++) { p[i] = p[i - 1] * x % mod; h[i] = (h[i - 1] + p[i] * (s[i] - 'a' + 1) % mod) % mod; } } long long getHash(int l, int r) { long long res = h[r]; if (l) res = (res - h[l - 1] + mod) % mod; res = res * p[p.size() - 1 - l] % mod; return res; } }; Этот способ непригоден для сравнения участков двух строк разной длины. В данном случае хеш более левого участка следует домножать на x|L1 - L2|. |
hi = s0 + s1x + s2x2 + ... + sn - 1xn - 1. Для выравнивания хеши различных подстрок домножаются на (x-1)L. struct Hasher { long long x = 31, xi = 129032259, mod = 1e9 + 7; vector<long long> p, pi, h; Hasher(const string &s) { p.resize(s.size()); pi.resize(s.size()); h.resize(s.size()); p[0] = pi[0] = 1; h[0] = s[0] - 'a' + 1; for (int i = 1; i < s.size(); i++) { p[i] = p[i - 1] * x % mod; pi[i] = pi[i - 1] * xi % mod; h[i] = (h[i - 1] + p[i] * (s[i] - 'a' + 1) % mod) % mod; } } long long getHash(int l, int r) { long long res = h[r]; if (l) { res = (res - h[l - 1] + mod) % mod; res = (res * pi[l]) % mod; } return res; } }; |
Ссылки
Теория:
- e-maxx.ru — Алгоритмы хэширования в задачах на строки
- neerc.ifmo.ru — Поиск подстроки в строке с использованием хеширования. Алгоритм Рабина-Карпа
- neerc.ifmo.ru — Поиск наибольшей общей подстроки двух строк с использованием хеширования
- ru.algorithmica.org — Полиномиальное хеширование
- habrahabr.ru — Полиномиальные хеши и их применение
- codeforces.com — Anti-hash test
- codeforces.com — Полиномиальное хеширование + разбор интересных задач
- Калинин П. — Про хеширование без домножения
- usaco.guide — String Hashing
Код:
Задачи: