В статье рассматривается вложение Takens для двух- и
трехмерной визуализации данных одномерных временных рядов. Топологический
анализ данных (TDA) – это область науки, в которой анализируются топологические
свойства данных. В последние годы возрос интерес к использованию методов
алгебраической топологии для топологического анализа данных (TDA – topological
data analysis) [1 , 2, 3] и применению в различных областях знаний. TDA
предполагает, что данные имеют форму, которая может иметь значение. Ранний
вклад в область TDA внесли Edelsbrunner H. и Harer J. L. [1]. Zomorodian A. и
Carlsson G. использовали основу для разработки методики TDA: Persistent
Homology [2, 3, 4]. Целью TDA является определение информативных топологических
свойств и использование их в качестве дескрипторов.
Ключевым математическим инструментом в топологическом
анализе данных является метод персистентных гомологий (PH–persistent
homology) [1, 4], который используется для извлечения
топологической информации из данных. Рассмотрим способ формирования
PH
из
точек данных в евклидовом пространстве. Целью является получение топологии из
конечных данных. Рассмотрим
-шары
(радиуса
) для реконструкции топологии. Ожидается, что модель
-шаров
может
представлять основные топологические структуры. Если
мал, то
объединение всех
-шаров
состоит из непересекающихся
-шаров.
Если радиусы
слишком большие, то объединение становится одним
пространственным компонентом. Персистентная гомология рассматривает все
значения
одновременно
и обеспечивает выражение для топологических свойств.
Метод TDA можно использовать для извлечения знаний из
временных рядов
[5, 6, 7].
Состояния динамических
систем меняются во времени; при этом формируются временные ряды. Состояние
системы
в
момент времени
–
это описание системы, а эволюция системы в пространстве состояний определяется
функцией перехода
.
Аттракторы определяют множество состояний системы, к точкам которого
направлена траектория.
-мерное
многообразие – это топологическое пространство
,
для
которого каждая точка
имеет окрестность, гомеоморфную евклидову пространству
,
глобально
может
обладать сложной топологической структурой. Гладкое отображение
,
где
и
– гладкие
многообразия, является вложением
в
,
если
–
диффеоморфизм из
в гладкое подмногообразие
.
Тогда
является пространством вложения с размерностью
вложения
.
Takens
вложение координат [8] позволяет реконструировать временной ряд в пространстве
более высокой размерности, так что сохраняется топология исходного
многообразия, которое генерирует значения временного ряда. Метод Takens находит
функцию
,
которая отображает многообразие
в многообразие
:
,
где
–
размерность вложения.
Вложение Takens позволяет преобразовывать данные
временных рядов в значимые облака точек для вычисления персистентной гомологии
[8, 9, 10, 11].
Кроме того, использование
метода скользящего окна позволяет сегментировать длинные временные ряды на
фрагменты, что делает топологические признаки сопоставимыми внутри наборов
данных и между ними.
Метод TDA с вложением Takens имеет широкое применение
в химии и биологических системах
[12],
теории
сигналов
[13],
при
исследовании динамических систем [14] и т.д. Использование метода TDA для
сравнения изображений [15, 16] позволяет классифицировать и идентифицировать
изображения (или сигналы другой физической природы).
В настоящей работе рассматривается использование TDA совместно
с вложением Takens для анализа выходной информации динамической системы –
твердого тела.
Примерами твердых тел могут такие объекты, как
летательные аппараты, которые содержат системы управления (например, системы
управления ориентацией). Приборный состав систем управления состоит из
чувствительных элементов и исполнительных органов. Для измерения трех компонент
вектора угловой скорости твердого тела обычно используются чувствительные
элементы – датчики угловой скорости (или блок датчиков угловой скорости,
который формирует информацию о проекциях вектора угловой скорости твердого тела
на оси главных моментов инерции твердого тела).
Построены 3D изображения кривых, построенных по трем
компонентам вектора угловой скорости твердого тела для различных значений
главных моментов инерции. Построены 3D изображения кривых, построенных на
основе вложения Takens для компонент
угловой скорости твердого тела для различных значений
главных моментов инерции. Использование метода TDA совместно с вложением Takens
для сравнения изображений (или сигналов другой физической природы) позволяет
классифицировать и идентифицировать информацию с датчиков.
Геометрия, представленная данными в метрическом
пространстве, не всегда актуальна; иногда интерес представляют более базовые свойства,
такие как количество компонентов, отверстий или пустот. Алгебраическая топология
[17]
фиксирует эти свойства, считая их или
связывая с ними векторные пространства или алгебраические структуры. Гомология
полевых коэффициентов ставит в соответствие векторному пространству
пространство
для каждого
натурального числа
такого, что
– число компонент связности в
,
– количество дырок в
,
–
количество пустот в
и
–
-я
группа
гомологий в
описывает
-мерные
дыры
в
.
Симплекс – это
-мерный
аналог треугольника или тетраэдра.
-симплекс
–
это
-мерный
многогранник, созданный выпуклой оболочкой его
вершины. Пусть
–
-симплекс.
Вершина
– это каждая из n+1 точек, используемых для определения
,
а грань
– это
выпуклая оболочка любого подмножества вершин
.
Симплициальный комплекс – это топологическое
пространство, реализованное как объединение любого набора симплексов
,
обладающее
следующими двумя свойствами: (1) любая грань симплекса
также лежит
в
;
(2) пересечение
любых двух симплексов
также является симплексом.
Метод персистентных гомологий изучает качественные
аспекты данных, вычисляя их топологические характеристики. Он устойчив к
возмущениям, не зависит от размеров и координат вложения и может обеспечить
представление качественных характеристик данных. В качестве входных данных
используется облако точек в метрическом пространстве; например,
в евклидовом
пространстве
.
Для сопоставления топологического пространства строятся симплициальные
комплексы.
После вычисления симплициальных комплексов признаки
преобладают в пространстве состоящем из вершин, ребер и других многогранников
большей размерности. Затем, используя гомологию, можно измерить такие
характеристики, как компоненты, дыры, пустоты и другие эквивалентные характеристики
более высокого измерения. Постоянство этих функций представлено на
персистентных диаграммах или персистентных баркодах.
Персистентная гомология фиксирует, как долго
сохраняются топологические особенности. Ранги персистентных гомологических групп
представлены на диаграммах персистентности. Это мультимножество точек в
и определяется
как [1]:
персистентная гомология может быть визуализирована
персистентной диаграммой (PD–persistence
diagram)
.
Каждая
точка
,
которая
называется генератором персистентной гомологии, представляет топологическое
свойство, которое представляет топологическое свойство, появляющееся при
и исчезающее
при
в модели
-шаров.
Топологическое свойство с высокой персистентностью
может
рассматриваться как надежная структура, в то время как топологическое свойство
с низкой персистентностью может рассматриваться как шум. Персистентной
диаграммы кодируют топологическую и геометрическую информацию о точках данных.
Максимальная персистентность определяется как:
где
– диаграмма
персистентности для
-й
гомологии.
Динамические системы строятся из пространства
состояний. Система считается динамической, поскольку состояния могут меняться в
зависимости от времени. Динамические системы могут быть как детерминированными,
так и стохастическими. Динамическая система описывается в пространстве
состояний
,
пространстве времени
и определяется функцией перехода
.
Состояние
определяется через состояние
с
использованием функции перехода
:
,
где
.
Динамические системы используются для моделирования
систем, состояния которых меняются во времени. Состояние
в момент
времени
–
это описание системы, а эволюция системы в пространстве состояний определяется
функцией перехода
.
Аттракторы определяют множество состояний системы, к точкам которого
направлена траектория. Временной ряд определяется наблюдаемыми состояниями
динамической системы.
-мерное
многообразие – это топологическое пространство
,
для которого каждая точка
имеет
окрестность, гомеоморфную евклидову пространству
.
Гладкое отображение
,
где
и
– гладкие многообразия, является вложением
в
,
если
–
диффеоморфизм из
в гладкое подмногообразие
(пространство вложения).
Takens
вложение координат позволяет реконструировать временной ряд в пространстве
более высокой размерности, так что сохраняется топология исходного
многообразия, которое генерирует значения временного ряда. Takens предположил,
что
-мерное
многообразие, содержащее аттрактор
,
может быть вложено в
[8]. Метод Takens находит функцию
,
которая
отображает
,
где
–
размерность вложения, которая может быть
.
Таким образом, вложение Takens дает возможность
получить непрерывное преобразование исходного многообразия M в
,
где
–
размерность вложения, а
– матрица траекторий. Пусть
– временной ряд, а
– матрица траектории:
,
|
(1)
|
где
каждая точка пространства представлена строкой. Более формальное определение
дается в [10].
Предположим, что
для некоторого
,
где
– кривая на многообразии
.
Предположим, что
посещает каждую часть
,
что означает, что
плотно в
относительно своей топологии. Тогда существует
,
где
обозначает
действительные числа, такие, что соответствующие векторы
находятся на
многообразии, топологически эквивалентном
.
Пример 1.
Пример вложения Takens.
Обозначим через
восстановленный одномерный временной ряд, где
- время,
- время
задержки, а
-
размерность реконструкции. Пусть наш одномерный временной ряд будет
.
Используя
(1) для одномерной реконструкции с
,
получим временной ряд
.
Определение размерности вложения Takens основан на
методе ложных ближайших соседей [9]. Свойство вложения состоит в том, что,
когда размерность вложения
слишком мала, удаленные точки в исходном фазовом пространстве являются
близкими точками в восстановленном фазовом пространстве. Эти точки называются
ложными соседями. При вычислении ложного ближайшего соседа для каждой точки
ищем
ближайшего соседа
в
-мерном
пространстве. После этого рассчитывается соотношение
.
Если
отношение
превышает
заданный порог
,
то точка помечается как ложный сосед. Если размер вложения достаточно высок,
отношение
равно
нулю. Один из способов вычислить
– встроить временной ряд
с
запаздыванием
в
диапазон различных измерений вложения
.
Необходимо найти всех ближайших соседей и вычислить
процент соседей, оставшихся после развертывания дополнительных измерений.
При оценке временной задержки
важны два
критерия: 1)
должна
быть достаточно большой, чтобы информация о значении
в момент
времени
значительно
отличалась от информации, уже известной из наблюдения значения
в момент
времени
;
2)
не должна
быть достаточно большой, чтобы система не теряла память о своем начальном
состоянии [11].
Для сравнения изображений определим расстояния между
этими изображениями: чем больше разница между изображениями, тем больше
расстояние между ними; расстояние между одинаковыми изображениями равно нулю.
Евклидовы преобразования изображений не должны изменять расстояние между ними.
Для определения расстояния между изображениями (или
объектами другой физической природы) применяется персистентный ландшафт — кусочно-линейная
функция, которая представляет собой обобщение персистентной диаграммы [18].
Персистентный ландшафт поворачивает диаграмму постоянства так, что диагональ
становится новой осью
.
-й
порядок персистентности ландшафтов создает кусочно-линейную функцию от
-го
наибольшего значения точек на диаграмме персистентности после поворота. Для
пары
,
где
- диаграммы
персистентности, кусочно-линейные функции
,
равны:
|
(2)
|
Тогда функция персистентного ландшафта (PL) определяется
как:
:
.
|
(3)
|
Сформируем
ядро функций PL:
|
(4)
|
Для функций
PL
сформируем
-норму
[18]:
|
(5)
|
где
.
Расстояния между функциями
PL
можно определить с помощью
-нормы:
|
(6)
|
где
.
Пусть
и
– две персистентные диаграммы. Персистентная диаграмма состоит из
конечного числа точек выше диагонали. К этому конечному множеству добавим
бесконечное число точек на диагонали. Рассмотрим биекции
и запишем
sup
(наименьшую
верхнюю границу) расстояний между соответствующими точками для каждой. Измерив
расстояние между точками
и
с
нормой:
,
|
(7)
|
и
взяв
inf
(наибольшую
верхнюю границу) по всем биекциям, получим расстояние Bottleneck между
диаграммами (1):
.
|
(8)
|
Расстояние Вассерштейна
-степени
между
и
:
|
(9)
|
где
.
Пример 2.
Пример свободного движения твердого тела
Компоненты вектора угловой скорости
примем равными нулю:
.
а) Рассмотрим случай твердого тела с
главными компонентами тензора инерции:
Начальные значения компонент вектора
угловой скорости твердого тела:
.
Шаг интегрирования системы
дифференциальных уравнений:
Баркоды 3D изображения эволюции компонент
вектора угловой скорости твердого тела.
Баркоды размерности 0: 14[0.0, 0.05);
[0.0, 0.1); [0.0, infinity).
Баркоды размерности 1: [0.1, 0.5).
Рисунок 1. Компоненты вектора угловой скорости
твердого тела для случая главных моментов инерции
:
Рисунок 2. 3D
изображение эволюции компонент вектора угловой
скорости твердого тела для случая главных моментов инерции
б) Рассмотрим случай твердого тела с главными
компонентами тензора инерции:
Начальные значения компонент вектора угловой скорости
ТТ:
.
Шаг интегрирования системы дифференциальных уравнений:
Баркоды 3D изображения эволюции компонент вектора
угловой скорости твердого тела.
Баркоды размерности 0: 10[0.0, 0.05);
.
Баркоды размерности 1: [0.05, 0.45).
На рис. 1 представлены графики компонент
вектора угловой скорости твердого тела для случая главных моментов инерции
На рис. 2 представлено 3D
изображение эволюции компонент вектора угловой
скорости твердого тела для случая главных моментов инерции
Рисунок 3. Компоненты вектора угловой скорости
твердого тела для случая главных моментов инерции
:
Рисунок 4. 3D
изображение эволюции компонент вектора угловой
скорости твердого тела для случая главных моментов инерции
Баркоды 3D
изображения эволюции компонент вектора угловой скорости твердого тела.
Баркоды размерности 0: 10[0.0, 0.05);
.
Баркоды размерности 1: [0.05, 0.45).
На рис. 3 представлены графики компонент
вектора угловой скорости твердого тела для случая главных моментов инерции
На рис. 4 представлено 3D
изображение эволюции компонент
вектора угловой скорости твердого тела для случая главных моментов инерции
Расстояние Bottleneck между 3D
изображениями (баркодами размерности 1):
Пример 3. Вложение Takens для
3D
.
а) Рассмотрим случай твердого тела с главными компонентами
тензора инерции:
Баркоды
размерности 1:
.
На рис. 5 представлена визуализация трехмерного
изображения вложения Taken's компоненты угловой скорости
для случая
главных моментов инерции:
Рисунок 5. 3D изображение вложения Takens компоненты
для случая
главных моментов инерции
б) Рассмотрим случай твердого тела с главными компонентами
тензора инерции:
Баркоды
размерности 1:
.
На рис. 6 представлена визуализация трехмерного
изображения вложения Taken's компоненты угловой скорости
для случая
главных моментов инерции:
Рисунок 6. 3D изображение вложения Takens компоненты
для случая
главных моментов инерции
Расстояние Bottleneck между изображениями (баркодами):
В работе рассматривается вложение Takens для двух- и
трехмерной визуализации данных одномерных временных рядов.
Рассмотрено использование топологического анализа
данных совместно с вложением Takens для анализа выходной информации
динамической системы – твердого тела. Построены 3D изображения кривых,
построенных по трем компонентам вектора угловой скорости твердого тела для
различных значений главных моментов инерции. Построены трехмерные изображения
кривых, построенных на основе вложения Takens для компоненты угловой скорости
твердого тела для различных значений главных моментов инерции.
Использование метода TDA совместно с вложением Takens для
сравнения изображений позволяет классифицировать и идентифицировать изображения
(или сигналы другой физической природы).
Предлагаемый метод TDA совместно с вложением Takens может
быть использован для распознавания образов, анализа данных в системах
управления объектами (например, в системе управления ориентацией летательного
аппарата).
Преимущество метода TDA заключается в инвариантности
по отношению евклидовым преобразованиям компонент выходной информации приборов
и в увеличении количества анализируемой информации (по отношению к традиционным
топологическим методам) за счет использования информации о баркодах.
Работа выполнена в рамках
государственного задания ИМ СО РАН, проект
FWNF-2022-0016, и
при поддержке Российского научного фонда, грант № 22-21-00035.
1. Edelsbrunner H., Harer J. L.
Computational topology: an introduction. – American Mathematical Society, 2022.
2. Zomorodian A., Carlsson G. Computing persistent homology
//Proceedings of the twentieth annual symposium on Computational geometry. –
2004. –
С. 347-356.
3. Carlsson G. Topology and data //Bulletin of the American
Mathematical Society. – 2009. –
Т. 46. – №. 2. –
С. 255-308.
4. Wasserman L. Topological Data Analysis //arXiv e-prints. –
2016. – С. arXiv: 1609.08227.
5. Bourakna A. E. Y., Chung M. K., Ombao H. Topological Data
Analysis for Multivariate Time Series Data //arXiv preprint arXiv:2204.13799. –
2022.
6. Pereira C. M. M., de Mello R. F. Persistent homology for
time series and spatial data clustering //Expert Systems with Applications. –
2015. – Т. 42. – №. 15-16. – С. 6026-6038.
7. Gidea M., Katz Y. Topological Data Analysis of Financial
Time Series: Landscapes of Crashes
//arXiv preprint arXiv:1703.04385. – 2017.
8.
Takens F. Dynamical systems and turbulence //Warwick, 1980. – 1981. – С.
366-381.
9.
Kennel M. B., Brown R., Abarbanel H. D. I. Determining embedding dimension for
phase-space reconstruction using a geometrical construction //Physical review
A. – 1992. – Т. 45. – №. 6. – С. 3403-3411.
10.
Torku T. T. Takens Theorem with Singular Spectrum Analysis Applied to Noisy
Time Series: дис. – East Tennessee State University, 2016.
11.
Kodba S., Perc M., Marhl M. Detecting chaos from a time series //European
journal of physics. – 2004. – Т. 26. – №. 1. – С. 205.
12.
Offroy M., Duponchel L. Topological data analysis: A promising big data
exploration tool in biology, analytical chemistry and physical chemistry
//Analytica chimica acta. – 2016. – Т. 910. – С. 1-11.
13.
Perea J. A., Harer J. Sliding windows and
persistence: An application of topological methods to signal analysis
//Foundations of Computational Mathematics. – 2015. –
Т. 15. – №. 3. –
С. 799-838.
14.
Maletić S., Zhao Y., Rajković M.
Persistent topological features of dynamical systems //Chaos: An
Interdisciplinary Journal of Nonlinear Science. – 2016. –
Т. 26. – №.
5. – С. 053105.
15. Чуканов С. Н. Сравнение
изображений объектов методами вычислительной топологии // Информатика и
автоматизация. – 2019. – Т. 18. – №. 5. – С. 1043-1065.
16.
Лейхтер С. В., Чуканов С. Н. Сравнение изображений на основе их диффеоморфного
преобразования // Компьютерная оптика. – 2018. – Т. 42. – №.
1. – С. 96-104.
17.
Hatcher A. Algebraic topology. – Cambridge UP. – 2005.
18.
Bubenik P. The persistence landscape and some of its properties // Topological
Data Analysis. – Springer, Cham, 2020. – С. 97-117.
Using Topological Data Analysis to Visualize Instrument Output
Authors: S.N. Chukanov1,A, I.S. Chukanov2,B
A Sobolev Institute of Mathematics of the Siberian Branch of RAS, Omsk branch, Omsk, Russia
B Ural Federal University named after the first President of Russia B. N. Yeltsin, Ekaterinburg, Russia
1 ORCID: 0000-0002-8106-9813, ch_sn@mail.ru
2 ORCID: 0000-0001-9946-7484, chukanov02@gmail.com
Abstract
The article discusses Takens embedding for 2D and 3D visualization of 1D time series data. The paper considers the use of topological data analysis in conjunction with Takens embedding to analyze the output information of a dynamic system - a rigid body. 3D images of curves constructed from three components of the angular velocity vector of a rigid body for various values of the main moments of inertia are constructed. Three-dimensional images of the curves constructed on the basis of the Takens embedding for the component of the angular velocity of a rigid body for various values of the principal moments of inertia are constructed. Distances between 3D images of curves are determined by constructing persistent landscape functions. Using the method of topological data analysis in conjunction with Takens embedding for image comparison allows you to classify and identify images and output information of the instrumental composition.
Keywords: topological data analysis, persistent homology, Takens embedding, rigid body dynamics.
1. Edelsbrunner H., Harer J. L.
Computational topology: an introduction. – American Mathematical Society, 2022.
2. Zomorodian A., Carlsson G. Computing persistent homology
//Proceedings of the twentieth annual symposium on Computational geometry. –
2004. – pp. 347-356.
3. Carlsson G. Topology and data //Bulletin of the American
Mathematical Society. – 2009. – Vol. 46. – №. 2. – pp. 255-308.
4. Wasserman L. Topological Data Analysis //arXiv e-prints. –
2016. – arXiv: 1609.08227.
5. Bourakna A. E. Y., Chung M. K., Ombao H. Topological Data
Analysis for Multivariate Time Series Data //arXiv preprint arXiv:2204.13799. –
2022.
6. Pereira C. M. M., de Mello R. F. Persistent homology for
time series and spatial data clustering //Expert Systems with Applications. –
2015. – Vol. 42. – №. 15-16. – pp. 6026-6038.
7. Gidea M., Katz Y. Topological Data Analysis of Financial
Time Series: Landscapes of Crashes
//arXiv preprint arXiv:1703.04385. –
2017..
8.
Taken F. Dynamical systems and turbulence //Warwick, 1980. – 1981. – pp. 366-381.
9.
Kennel M. B., Brown R., Abarbanel H. D. I. Determining embedding dimension for
phase-space reconstruction using a geometrical construction //Physical review
A. – 1992. – Vol. 45. – №. 6. – pp. 3403-3411.
10.
Torku T. T. Takens Theorem with Singular Spectrum Analysis Applied to Noisy
Time Series: Diss. – East Tennessee State University, 2016.
11.
Kodba S., Perc M., Marhl M. Detecting chaos from a time series //European
journal of physics. – 2004. – Vol. 26. – №. 1. – pp. 205.
12.
Offroy M., Duponchel L. Topological data analysis: A promising big data
exploration tool in biology, analytical chemistry and physical chemistry
//Analytica chimica acta. – 2016. – Vol. 910. – pp. 1-11.
13.
Perea J. A., Harer J. Sliding windows and
persistence: An application of topological methods to signal analysis
//Foundations of Computational Mathematics. – 2015. – Vol. 15. – №. 3. – pp. 799-838.
14.
Maletić S., Zhao Y., Rajković M.
Persistent topological features of dynamical systems //Chaos: An
Interdisciplinary Journal of Nonlinear Science. – 2016. – Vol. 26. – №. 5. –
pp. 053105.
15. Chukanov
S.N. Comparison of object images by methods of computational topology. //
Informatics and automation. –
2019. –
Vol. 18. –
№.
5. –
pp. 1043-1065.
16.
Leikhter S.V., Chukanov S.N. Comparison of images based on their diffeomorphic
transformation. // Computer Optics. –
2018. –
Vol. 42. –
№
1. –
pp. 96-104.
17.
Hatcher A. Algebraic topology. – Cambridge UP. – 2005.
18.
Bubenik P. The persistence landscape and some of its properties // Topological
Data Analysis. – Springer, Cham, 2020. – pp. 97-117.