Лекция в МГУ Концепция скрытых (латентных) переменных в химическом анализе. Часть 1. Качественный анализ Институт химической физики РАН им Семенова Российское хемометрическое общество Померанцев Алексей Леонидович
Лекция в МГУ Вопрос 1. Кто я ? Еще студент Уже не студент Еще студент Уже не студент
Лекция в МГУ Вопрос 2. Моя направленность Экспериментатор Теоретик Я ошибся комнатой Экспериментатор Теоретик Я ошибся комнатой
Лекция в МГУ Вопрос 3. Специальность Химик Физик Биолог Математик Химик Физик Биолог Математик
Лекция в МГУ Вопрос 4. Область Аналитическая химия Органическая химия Физическая химия Не занимаюсь ничем подобным Аналитическая химия Органическая химия Физическая химия Не занимаюсь ничем подобным
Лекция в МГУ Вопрос 5. Специализация Электрохимия Хроматография Спектроскопия Масспектрометрия Хемометрика Электрохимия Хроматография Спектроскопия Масспектрометрия Хемометрика
Лекция в МГУ Вопрос 6. Знаю (читал)... 1 журнал по аналитической химии 2 журнала по АХ 4 журнала по АХ больше 6 журналов по АХ 1 журнал по аналитической химии 2 журнала по АХ 4 журнала по АХ больше 6 журналов по АХ
Лекция в МГУ Вопрос 7. Хемометрика это... статистика в аналитической химии метрология применительно к АХ то, что делают хемометрики понятия не имею ?! статистика в аналитической химии метрология применительно к АХ то, что делают хемометрики понятия не имею ?!
Лекция в МГУ Данные о нас Матрица данных образец/объект переменная/свойство
Лекция в МГУ Матрицы и векторы: учебник
Лекция в МГУ Графическое представление 2D-данных
Лекция в МГУ Графическое представление 3D-данных
Лекция в МГУ Почти наши данные
Лекция в МГУ Таблица данных
Лекция в МГУ Корреляции 1
Лекция в МГУ Корреляции 2
Лекция в МГУ 12(12-1)/2=66 Все возможные корреляции
Лекция в МГУ Главные направления и проекции Данные без структуры Данные со скрытой структурой X 2 =aX 1 +E
Лекция в МГУ Проекция на подпространство Проекции данных Главные компоненты Подпространство Исходные данные Центр данных
Лекция в МГУ Представление данных в подпространстве
Лекция в МГУ Метод главных компонент: МГК (PCA) Karl Pearson, 1901 X t 1 p 1 = t A p A E X - матрица данных, E - матрица погрешностей, обе (I J) T - матрица счетов: (I A), P - матрица нагрузок: (A J) A - число главных компонент (A
Лекция в МГУ Unscrambler® by CAMO ASA
Лекция в МГУ Matlab
Лекция в МГУ Люди: Графики счетов
Лекция в МГУ Люди: Графики нагрузок
Лекция в МГУ Разделение пиков в ВЭЖХ-ДАМ
Лекция в МГУ Свойства чистых веществ A и B X=CS T +E
Лекция в МГУ Хроматограмма смеси
Лекция в МГУ Данные в Unscrambler
Лекция в МГУ График счетов B A
Лекция в МГУ Выводы из графика счетов 1. линейные участки = чистые компоненты 2. кривые участки = коэлюция 3. ближе к началу = меньше интенсивность 4. число поворотов = число чистых компонент
Лекция в МГУ Факторный анализ и анализ ГК X E1E1 + = C STST × 2 J I I J X E2E2 + = T PTPT × A J I I J
Лекция в МГУ Счета и нагрузки
Лекция в МГУ Прокрустово преобразование X CS T X TP T I = RR T = единичная X T(RR T )P T = (TR)(PR) T C TR S PR R = R stratch ×R rotation ^^
Лекция в МГУ Преобразование счетов СЖАТИЕ
Лекция в МГУ Результат Прокрустова преобразования
Лекция в МГУ Классификация поддельных лекарств
Лекция в МГУ Измерения: БИК спектроскопия
Лекция в МГУ Образцы Подлинники: 11 серий по 5 таблеток Подделки: 4 серии по 5 таблеток Всего 15×5= 75 образцов Подлинники: 8 серий по 5 таблеток Всего: 8×5= 40 образцов Обучающий набор Подлинники: 3 серии по 5 таблеток Подделки: 4 серии по 5 таблеток Всего: 7×5= 35 образцов Проверочный набор
Лекция в МГУ БИК спектры мезима Настоящие Фальшивые
Лекция в МГУ Данные: БИК спектры длины волн (переменные x 1, x 2, x 3, … ) образцы X
Лекция в МГУ График МГК счетов Подлинники: 8 серий по 5 таблеток Всего: 8×5= 40 образцов Обучающий набор Подлинники: 3 серии по 5 таблеток Подделки: 4 серии по 5 таблеток Всего: 7×5= 35 образцов Проверочный набор
Лекция в МГУ Размах и отклонение Размах h: расстояние внутри модели Отклонение d: расстояние до модели эллипс Хоттелинга: нормальные образцы
Лекция в МГУ Размах и отклонение для мезима размах отклонение
Лекция в МГУ SIMCA Soft Independent Modeling of Class Analogy формальное независимое моделирование аналогий классов G13-1
Лекция в МГУ Выброс G13-1 H2OH2O
Лекция в МГУ Хемометрика - это научная дисциплина, находящаяся на стыке химии и математики, предметом которой являются математические методы исследования химических данных сайт Российского хемометрического общества Хемометрика: два определения Дедуктивное Хемометрика – это то, что делают хемометрики. сайт Международного хемометрического общества Хемометрики – это такие люди, которые все время пьют пиво и воруют идеи у математиков Svante Wold Индуктивно е
Лекция в МГУ Что делают хемометрики? контролируют производство полупроводников, аспирина и пива; исследуют причины разрушения старинных документов; проводят допинг контроль спортсменов; расшифровывают состав косметики Древнего Египта; локализуют месторождение золота в Швеции; идентифицируют подозреваемого в убийстве Анны Линд; проводят диагностику артрита и рака на ранних стадиях; исследуют органические субстанции в кометном веществе; исследуют кормовой рацион на свинооткормочных комплексах; проверяют, как рацион питания влияет на умственные способности; определяют фальшивые лекарства; и еще многое, многое другое контролируют производство полупроводников, аспирина и пива; исследуют причины разрушения старинных документов; проводят допинг контроль спортсменов; расшифровывают состав косметики Древнего Египта; локализуют месторождение золота в Швеции; идентифицируют подозреваемого в убийстве Анны Линд; проводят диагностику артрита и рака на ранних стадиях; исследуют органические субстанции в кометном веществе; исследуют кормовой рацион на свинооткормочных комплексах; проверяют, как рацион питания влияет на умственные способности; определяют фальшивые лекарства; и еще многое, многое другое
Лекция в МГУ А если серьезно.... Хемометрика имеет дело с данными (зачас- тую с очень большими), поэтому хемометрика - это подраздел информатики (Data mining) Данные, которые исследует хемометрика по большей части происходят из химии, поэтому хемометрика - это подраздел химии (Analytical chemistry) Методы, которые использует хемометрика ориентированы на формальное моделирование (Soft modeling) Хемометрика имеет дело с данными (зачас- тую с очень большими), поэтому хемометрика - это подраздел информатики (Data mining) Данные, которые исследует хемометрика по большей части происходят из химии, поэтому хемометрика - это подраздел химии (Analytical chemistry) Методы, которые использует хемометрика ориентированы на формальное моделирование (Soft modeling)
Лекция в МГУ Два «не» и три «да» 1. Хемометрика химическая метрология 2. Хемометрика статистика в химии 1. Хемометрика химическая метрология 2. Хемометрика статистика в химии Хемометрика решает следующие задачи в области химии: (1) как получить химически важную информацию из химических данных, (2) как организовать и представить эту информацию, (3) как получить данные, содержащие такую информацию. Хемометрика решает следующие задачи в области химии: (1) как получить химически важную информацию из химических данных, (2) как организовать и представить эту информацию, (3) как получить данные, содержащие такую информацию.
Лекция в МГУ Что можно почитать...
Лекция в МГУ Что осталось на потом...
Лекция в МГУ Спасибо за внимание!