17 января. Землетрясение в Кобе : почему мир начал иначе думать о живучести систем

живучесть системы17 января 1995 года в 5:46 утра по местному времени район японского города Кобе и южной части префектуры Хёго потрясло сильнейшее землетрясение, известное как Великое землетрясение Хансин–Авадзи. Оно длилось около 20 секунд, имело магнитуду порядка 6,9 (в разных оценках встречаются и другие значения), и привело к катастрофическим разрушениям в городе и его инфраструктуре.

Это событие полезно нам не как “страшная история”. Оно полезно как испытание системы на прочность в реальных условиях. За считанные секунды стало видно, где конструкция выдерживает, а где ломается; где связь и управление сохраняются, а где исчезают; где есть запас прочности, а где всё держалось на привычке и удаче.

Именно поэтому Кобе- это урок о живучести. То есть о способности системы не только “не упасть”, но и вернуться к работе в понятные сроки.

Что произошло и почему разрушения оказались такими тяжёлыми

Кобе — крупная городская и промышленная зона, важный транспортный узел и порт. Землетрясение ударило очень жёстко: очаг был неглубоким, а толчки — резкими. Это привело к масштабным повреждениям зданий, пожарам и отказу ключевых элементов городской инфраструктуры.

Одним из символов катастрофы стали завалившиеся секции скоростной эстакады. Это не просто “картинка”. Это наглядная инженерная мысль: когда выходит из строя опорный элемент транспортной системы (мост, развязка, эстакада), следом рушится логистика — доставка, перемещения людей, снабжение, спасательные работы.

По официальным и научным обзорам, землетрясение привело к тысячам погибших и десяткам тысяч пострадавших; огромная часть жилья была повреждена, а коммунальные услуги (электричество, вода, газ) на большой территории оказались нарушены.

Как это повлияло на мир: от “строим прочнее” к “строим так, чтобы быстро восстанавливаться”

Главный мировой сдвиг после Кобе — не в банальном “надо строить лучше”. Это все и так понимают. Сдвиг в другом: появилась массовая осознанность, что нужно проектировать не только “на нормальный день”, но и на день, когда всё пошло не так.

1) Живучесть стала отдельной целью

Раньше многие системы проектируют под прочность и обычный режим работы. Кобе показало: нужно проектировать под срывы и восстановление функций. Не просто “чтобы не развалилось”, а чтобы в тяжёлых условиях сохранялись жизненно важные функции, и был понятный путь возвращения.

2) Самые болезненные провалы происходят на стыках

Дороги, мосты, порт, связь, больницы, доставка топлива и воды — всё связано. Если пропадает связь, теряется управление и координация. Если разрушены дороги, не приходит снабжение. Если порт стоит, регион получает экономический удар второй волной.

Есть исследования, которые оценивают косвенные экономические потери именно из-за разрушения транспортных артерий и портовой инфраструктуры — то есть ущерб не только “в бетоне”, но и в сорванных перевозках и цепочках поставок.

3) Появилось практическое мышление “как обеспечить непрерывность”

Сегодня любят говорить “план непрерывности”, “план восстановления”, “управление рисками”. Но смысл Кобе в том, что непрерывность — это не папка на полке. Это заранее выбранные критические функции, запасные пути, резервирование и тренировка действий, чтобы люди знали, что делать, когда “обычный день” закончился за 20 секунд.

Перевод на завод: ваш “Кобе” обычно приходит не как землетрясение

Завод редко сталкивается с катастрофой с табличкой “катастрофа”. Обычно это выглядит как цепочка вполне бытовых вещей:

  • внезапная остановка электричества;
  • отказ компрессоров (нет воздуха — встал инструмент и автоматика);
  • пожар на участке;
  • поломка ключевого станка или оснастки, без которой “ничего не сделать”;
  • уход ключевого технолога или наладчика;
  • провал поставщика сырья;
  • транспортные ограничения;
  • отказ системы учёта (склад, отгрузка, планирование);
  • массовый брак из-за сырья или настройки, который не поймали на входе.

Суть одна: система теряет функцию. А дальше вопрос не в том, кто виноват, а в том, есть ли у вас контур восстановления.

Ключевая мысль дня

Стабильность — это то, что вы чувствуете в обычные дни. Живучесть — это то, что решает судьбу бизнеса в плохие.

Протокол “Кобе для завода”: контур живучести 3×3×3

Чтобы это было не философией, а инструментом, держи простую структуру, которую можно внедрять даже в небольшом производстве.

Шаг 1. Три критических узла: что нельзя терять

Выберите три узла, от которых зависит большая часть способности выпускать и отгружать:

  1. Энергия и среда: электричество, сжатый воздух, вода, тепло, газ.
  2. Узкое место: конкретный станок, линия, печь, оснастка — то, что ограничивает выпуск.
  3. Контур управления: связь и учёт — доступ к заказам, спецификациям, складу, статусам.

Важно: не перечисляйте всё. Только три. Это дисциплина фокуса.

Шаг 2. Три сценария отказа: как это ломается

Для каждого узла опишите три сценария по длительности:

  • отказ на 2 часа;
  • отказ на сутки;
  • отказ на неделю (или “неизвестно когда”).

Это переключает мышление с “ну постоим” на “как мы действуем, если это затянулось”.

Шаг 3. Три механизма восстановления: что делаем заранее

Для каждого узла выберите три решения из разных классов:

  1. Резерв: запасной источник, запасная оснастка, договор аренды, дополнительный комплект расходников.
  2. Обходной путь: альтернативная операция, другая линия, внешний подрядчик, упрощённый маршрут производства.
  3. Процедура и роли: кто объявляет режим, кто фиксирует ущерб, кто решает приоритеты, кто связывается с клиентами, кто отвечает за снабжение и ремонт.

Кобе учит: техника без процедуры — просто железо. Процедура без ответственных — просто слова.

Мини-практика на 10–15 минут: “карта восстановления”

Возьмите один узел (самый болезненный) и заполните семь строк:

  1. Узел: что именно? (например, “компрессорная”, “станок №…”, “складской учёт”)
  2. Как выглядит отказ: что именно перестаёт работать?
  3. Порог перехода в режим аварии: через сколько времени вы перестаёте “надеяться”?
  4. Ответственный за режим: какая роль объявляет и руководит действиями?
  5. Первые 60 минут: пять действий по шагам (что фиксируем, кого уведомляем, что останавливаем, что переключаем)
  6. Обходной путь: как обеспечить минимальный выпуск или минимальную отгрузку?
  7. Показатель восстановления: до какого уровня (процент выпуска/отгрузки) и за сколько часов/дней вы должны вернуться.

Это маленький документ, но именно такие документы отличают “мы пережили” от “мы утонули в хаосе”.

Вопросы дня (выбери 3–5)

  1. Какой один узел на заводе способен остановить большую часть выпуска?
  2. Где у нас “знают в голове”, но не зафиксировано: что делать в первые 60 минут?
  3. Какой отказ мы считаем “маловероятным”, но его цена для нас смертельна?
  4. Есть ли у нас право перейти на “минимальный выпуск”, или мы всегда пытаемся спасать всё и теряем всё?
  5. Какая одна резервная мера окупится, если серьёзный сбой случится всего один раз в год?
  6. Какой показатель восстановления для нас главный: выпуск, отгрузка, качество или деньги?
  7. Что должно быть доказательством живучести через месяц: один узел, одна процедура, одна тренировка?

Вывод: это урок не про страх, а про зрелость управления

Землетрясение 17 января 1995 года показало, что катастрофа измеряется не магнитудой, а временем потери функций и скоростью возвращения к работе.
Для завода это значит: думать не только о плане производства, но и о восстановлении — пусть даже в простейшем виде: один узел, одна процедура, один показатель.

Система взрослеет в тот момент, когда у неё появляется ответ на вопрос:

Если завтра утром исчезнет один критический узел — мы знаем, что делаем в первые 60 минут, и когда вернёмся к 60–80% мощности?