Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения:
Databricks Runtime 18.1 и выше
Вычисляет сходство косинуса между двумя векторами, измеряя косинус угла между ними.
Синтаксис
vector_cosine_similarity(vector1, vector2)
Аргументы
-
vector1:
ARRAY<FLOAT>выражение, представляющее первый вектор. -
vector2:
ARRAY<FLOAT>выражение, представляющее второй вектор.
Возвраты
FLOAT Значение, представляющее сходство косинуса между двумя векторами. Результат варьируется от -1,0 (противоположных направлений) до 1,0 (то же направление), где 0,0 указывает на ортгональность.
Возвращается NULL для пустых векторов, если либо вектор имеет нулевое значение, либо если входные данные или NULL содержатся NULL.
Примечания
- Поддерживается только
ARRAY<FLOAT>другие типы, напримерARRAY<DOUBLE>илиARRAY<DECIMAL>возникают ошибки. - Оба вектора должны иметь одинаковое измерение; в противном случае функция вызывает VECTOR_DIMENSION_MISMATCH.
- Более высокие значения указывают на большее сходство; обычно используется для семантического сходства в внедренных пространствах.
Условия ошибок
Примеры
-- Basic cosine similarity
> SELECT vector_cosine_similarity(array(1.0f, 2.0f, 3.0f), array(4.0f, 5.0f, 6.0f));
0.9746318461970762
-- Identical vectors (maximum similarity)
> SELECT vector_cosine_similarity(array(1.0f, 0.0f, 0.0f), array(1.0f, 0.0f, 0.0f));
1.0
-- Orthogonal vectors
> SELECT vector_cosine_similarity(array(1.0f, 0.0f), array(0.0f, 1.0f));
0.0