← На главную

PCA по 78 894 видам — окаменелость из Альгата оказалась конвергентной

29.05.2026 02:49 · hackernews

В пустыне Альгат в Саудовской Аравии, в 500 км от побережья Даммама, у подножия скалы нашли твёрдый камень, который выглядит как морская раковина. Сомнений нет: это окаменелость. В позднем юрском периоде, около 150 миллионов лет назад, Аравийский полуостров был частично затоплен морем — об этом говорят карбонатные породы и морские ископаемые в этом районе.

Автор находки не палеонтолог, но решил разобраться сам. Подробный анализ с осадочными породами он проводить не умел, поэтому пошёл другим путём: изучил только форму окаменелости, то есть её морфологию. Он понимал, что это неточно (разные виды могут выглядеть одинаково), но было интересно.

Взял открытый датасет Zhang et al. — 78 894 вида и 59 244 изображения раковин. Главная проблема: как сравнить формы. Объекты можно повернуть, масштабировать, сдвинуть. Автор выровнял изображения: отцентрировал, привёл к единому масштабу, зафиксировал ориентацию по отверстию раковины, а поворот по оси выправил по самому длинному радиусу. Затем контур каждой раковины превратил в 256 точек с координатами (x, y) — получилась матрица 256×2.

Расстояние между раковинами считал как сумму квадратов евклидовых расстояний между соответствующими точками. Чтобы визуализировать пространство всех форм, применил метод главных компонент (PCA) — сократил 256 измерений до двух. Первая компонента (PC1) объяснила 56,5 % вариаций, вторая (PC2) — ещё 10,75 %. Выяснилось: PC1 отвечает за «заострённость» раковины, а PC2 — за симметрию. Круглые раковины встречаются чаще, но острые разнообразнее и грубее.

И вот финал: ближайший по форме к находке в пустыне вид — Sphincterochila candidissima. Но он совсем молодой: первые ископаемые датируются 38 миллионами лет назад, никак не юрским периодом. Автор предполагает, что сходство может объясняться конвергентной эволюцией — когда разные виды под влиянием среды становятся похожими. Просто по форме lineage не определишь, но совпадение впечатляет.

Своим инструментом можно пользоваться: https://shell.hawzen.me — можно загрузить своё изображение и найти его место в латентном пространстве раковин.

Читать оригинал →