위성이 상공에 떠 있고 픽셀 단위 분석을 시사하는 데이터 오버레이 격자가 덧입혀진 채, 홍수에 부분적으로 잠긴 해안 주거 지역의 항공 뷰 — 홍수 언더라이팅 기술에 특화된 이미지.
Artificial IntelligenceInsuranceClimate Change

당신의 홍수보험료는 1987년에 만든 지도에 근거합니다. 무엇이 그것을 대체해야 하는가.

Ashutosh SinghalAshutosh Singhal2026년 1월 31일14 min

작년에 저는 남동부의 한 중견 손해보험사(P&C)에서 근무하는 선임 언더라이터와 마주 앉았습니다. 그의 뒤 벽에는 지도가 하나 압정으로 — 말 그대로 압정으로 — 붙어 있었는데, 그의 팀이 활발하게 계약을 인수하던 해안 카운티의 FEMA 홍수 구역을 보여주는 지도였습니다. 저는 그 지도가 마지막으로 갱신된 것이 언제냐고 물었습니다.

그는 웃었습니다. "저 지도는 우리 애널리스트 대부분보다 나이가 많아요."

그는 과장하고 있지 않았습니다. 그 지도는 1992년 것이었습니다. 그리고 그는 그 지도를 — 약간의 우편번호 평균값과 함께 — 사용해 수천 채의 주택에 대한 홍수 위험을 산정하고 있었습니다. 세 차례의 대형 허리케인이 해안선을 다시 빚어냈고, 새로운 택지 개발이 습지를 포장해 덮어버렸으며, 배수 인프라가 더 이상 현실을 반영하지 않는 강우 강도에 맞춰 설계된 지역에서 말입니다.

그 대화는 저를 계속 따라다녔습니다. 그 언더라이터가 무능해서가 아니었습니다 — 그는 명민하고, 경험이 풍부했으며, 문제를 깊이 인식하고 있었습니다. 하지만 그 이유는그가 쓸 수 있는 도구들이 다른 기후 시대의 것이었고, 업계에는 그것들을 대체할 명확한 방법이 없었기 때문입니다.

그것이 바로 저희 Veriprajna 팀이 몇 달을 들여, 지금 저희가 홍수 언더라이팅을 위한 "Deep AI"라고 부르는 것을 연구하게 된 계기였습니다 — 컴퓨터 비전, 위성 레이더, 그리고 물리 정보 기반 머신러닝의 융합으로, 우편번호가 아니라 개별 건물 단위에서 홍수 위험을 평가할 수 있는 기술입니다. 저는전체 연구에 대한 인터랙티브 개요를 여기에 작성했습니다, 그리고 여기에 깊이 파고들수록, 이것이 있으면 좋은 정도의 업그레이드가 아니라는 확신이 점점 더 커졌습니다. 이것은 지급 능력의 문제입니다.

당신을 속이는 지도

대부분의 사람들이 — 많은 보험 전문가를 포함해 — FEMA 홍수 지도에 대해 충분히 이해하지 못하는 점이 있습니다: 그것들은 애초에 언더라이팅 도구로 설계된 적이 없다는 것입니다.

전체 국가홍수보험프로그램(NFIP)의 기준이 되는 "100년 홍수" 개념은 연간 1%의 홍수 발생 확률을 의미합니다. 드물게 들립니다. 하지만 그 확률을 30년 만기 모기지 전체에 걸쳐 계산하면26% 확률로 대출 기간 중 "100년 홍수"를 겪게 됩니다. 그것은 꼬리 위험이 아닙니다. 그것은 확률이 약간 더 나은 동전 던지기입니다.

지도 자체는 그 개념보다 더 나쁩니다. FEMA 홍수 지도의 약 75%가 5년 이상 된 것입니다. 일부는 1970년대와 1980년대까지 거슬러 올라갑니다. 그것들은 배수 패턴을 바꿔놓은 신축 건물을 반영하지 못합니다. 강우를 심화시키는 기후 변화를 반영하지 못합니다. 그리고 그것들은 제가 "절벽 효과"라고 부르기 시작한 것을 만들어냅니다 — 특별홍수위험지역(SFHA) 경계 안쪽으로 30센티미터 들어간 집은 의무 보험료로 수천 달러를 내는 반면, 경계 바깥쪽으로 30센티미터 나간 집은 최소 위험으로 분류되는 이분법적 경계선 말입니다.

물은 지도 위의 선 따위를 신경 쓰지 않습니다.

홍수 피해 보고의 거의 68%가 FEMA가 지정한 고위험 홍수 구역 밖에서 발생합니다. 지도는 단지 낡은 것이 아니라 — 체계적으로 오도하고 있습니다.

그 결과는 잘못된 정보 위에 세워진 시장입니다. 미국 주택 소유자 중 홍수 보험에 가입한 사람은 4% 미만입니다. 그들이 무모해서가 아니라, 지도가 그들에게 안전하다고 말했기 때문입니다.

왜 홍수 피해의 68%가 "홍수 구역" 밖에서 발생하는가?

하천 범람 홍수(강의 범람, FEMA가 모델링함)와 강우 홍수(불투수면 위의 강우, FEMA가 모델링하지 않음)를 나란히 비교하는 다이어그램으로, 대부분의 홍수 피해가 지정 구역 밖에서 발생하는 이유를 설명합니다.

이것은 제가 연구에서 처음 접했을 때 저를 얼어붙게 만든 통계였습니다. 데이터를 보기 전에 추측해보라고 했다면, 저는 아마 20%, 많아야 30%라고 말했을 것입니다. 하지만 68%라니요? 그것은 홍수 손실의 대다수가, 이를 예측해야 할 시스템에게 보이지 않는다는 뜻입니다.

그 답은 수문학 밖의 대부분 사람들이 한 번도 들어본 적 없는 단어입니다:강우 홍수(pluvial flooding).

FEMA 지도는 강이 제방을 넘어 범람하는 것(하천 범람 홍수)과 해안 폭풍 해일을 모델링합니다. 하지만 모든 진입로, 주차장, 지붕이 불투수면인 동네에 두 시간 동안 15센티미터의 비가 쏟아질 때 무슨 일이 벌어지는지는 모델링하지 않습니다. 물은 갈 곳이 없습니다. 물은 고입니다. 물은 가장 낮은 지점을 찾아냅니다 — 그것은 가장 가까운 강에서 5킬로미터 떨어진 누군가의 반지하 거실일 수도 있습니다.

저희 팀이 늦은 밤 통화에서 이것을 두고 논쟁하던 것이 기억납니다. 도시 수문학 문헌에 깊이 파고들어 있던 우리 연구원 중 한 명은, 미세 지형 — 도로의 미묘한 경사, 진입로가 차고 쪽으로 기울어졌는지 아니면 그 반대인지 — 이 강우성 사건에서는 강과의 근접성보다 더 중요하다고 계속 주장했습니다. 저는 반박했습니다. 그것은 포트폴리오 규모에서 의미를 갖기에는 너무 세밀하게 들렸습니다.

그는 하비 허리케인 이후 휴스턴의 피해 데이터를 띄웠습니다. 블록 단위로, 손실은 극도로 불균등했습니다. 같은 거리, 같은 우편번호, 같은 FEMA 지정을 받은 집들 — 하나는 침수되었고 하나는 그렇지 않았습니다. 그 차이는 종종 몇 센티미터의 고도 차이나 이웃의 옹벽이었습니다.

그때 저는 이해했습니다:우편번호 평균값은 단지 부정확한 것이 아닙니다. 그것은 홍수 위험에 대해 근본적으로 잘못된 분석 단위입니다.

8인치 혁명

컴퓨터 비전이 도로 촬영 사진에서 1층 고도(First Floor Elevation)를 추출하는 방법을 단계별로 보여주는 다이어그램으로, 지면선 식별, 문턱 식별, 계단 수 세기, 물리적 높이 계산 과정을 담고 있습니다.

홍수가 성가신 일에 그치느냐 아니면 재앙이 되느냐를 결정하는 단 하나의 변수가 있다면, 그것은1층 고도(First Floor Elevation)입니다 — 지면과 건물의 가장 낮은 거주 가능 층 사이의 수직 거리입니다.

여기서의 수치는 놀랍습니다. 주택의 1층을 기준 홍수 고도보다 단 30센티미터만 높여도 연평균 손실(Average Annual Loss)을 약90%줄일 수 있습니다. 30센티미터. 그것이 시한폭탄 같은 부동산과 지극히 보험 가입이 가능한 부동산 사이의 차이입니다.

그런데도 이 수치는 언더라이터의 파일에 거의 들어 있지 않습니다. 공공 세금 기록에는 담기지 않습니다. 고도 인증서(Elevation Certificate)는 비싼 수작업 문서입니다. 기존 모델들은 그냥 추측합니다 — 이를테면, 한 지역의 모든 주택이 표준 30센티미터 크롤스페이스를 가지고 있다고 가정하는 식으로 말입니다.

바로 여기서 컴퓨터 비전이 모든 것을 바꿉니다.

저희 팀은 신경망이 Google 스트리트 뷰 이미지에서 1층 고도를 어떻게 추출할 수 있는지 몇 주 동안 연구했습니다. 그 과정은 저를 놀라게 할 만큼 우아합니다. 합성곱 신경망은 주택의 도로 촬영 사진을 보고 지면선, 현관문 문턱, 계단을 식별합니다. 카메라에서 건물 정면까지의 거리를 추정합니다. 그런 다음 기본 삼각법 — 카메라 높이, 기울기 각도, 픽셀 위치 — 을 적용해 도로 위 출입구의 물리적 높이를 계산합니다.

심지어 아름다울 만큼 단순한 보조 방법도 있습니다: 계단 수 세기입니다. 건축 법규는 약 7인치의 표준 챌면 높이를 규정합니다. 현관까지 여섯 계단이라고요? 그것은 대략 42인치의 1층 고도입니다. CV 모델은 아무도 자리를 떠나지 않고 수백만 채의 부동산에 걸쳐 계단을 셀 수 있습니다.

최저층 고도 추정을 위해 훈련된 신경망은 평균 오차가 단 0.218미터 — 약 8.5인치 — 를 달성했습니다. 그것은 단 한 번의 현장 방문 없이, 대륙 전역 규모에서 센티미터 단위의 정밀도를 낸 것입니다.

그 오차 범위를 처음 봤을 때, 저는 눈을 의심했습니다. 지나가는 자동차가 찍은 사진에서 도출된 평균 오차 8.5인치라니요. 그것을, 한 우편번호 안의 모든 주택이 동일한 고도 프로파일을 가진다고 가정하는 기존 방식과 비교해 보십시오. 아예 같은 종목이 아닙니다.

구름을 꿰뚫어 볼 수 있으면 어떤 일이 벌어질까?

합성개구레이더(Synthetic Aperture Radar)가 구름을 통과해 홍수를 탐지하는 방법을 설명하는 다이어그램으로, 세 가지 핵심 레이더 거동을 보여줍니다: 잔잔한 물에 흡수되는 신호(어두운 픽셀), 마른 땅에 산란되는 신호(밝은 픽셀), 그리고 도시 지역에서의 이중 반사.

홍수 언더라이팅에는 잔인한 아이러니가 있습니다: 지상에서 무슨 일이 벌어지는지 가장 봐야 할 순간 — 홍수가 진행 중일 때 — 이 바로 광학 위성이 눈이 멀어버리는 때입니다. 홍수에는 구름과 비가 따라옵니다. 카메라는 그 어느 것도 꿰뚫어 볼 수 없습니다.

합성개구레이더는 구름 따위를 신경 쓰지 않습니다.

SAR 위성은 구름층, 연기, 폭우를 통과하는 마이크로파 펄스를 송신한 다음, 되돌아오는 에너지를 측정합니다. 잔잔한 물은 거울처럼 작용합니다 — 레이더 신호를 위성에서 멀어지는 방향으로 반사해, 이미지에서 어두운 픽셀로 나타납니다. 마른 땅은 신호를 되산란시켜 밝게 나타납니다. 그 대비가, 어떤 날씨에서든 낮이든 밤이든, 홍수 지도를 제공합니다.

SAR 데이터를 처음 접했을 때 저는 그것이 낯설게 느껴졌다는 것을 인정합니다. 그것은 사진처럼 보이지 않습니다. 거칠고, 얼룩덜룩하며, 직관적이지 않습니다. 하지만 그것이 무엇을 보여주는지 이해하고 나면, 그것은 경이롭습니다 — 사건이 정점에 이른 후 몇 시간 안에 홍수의 정확한 범위를 지도화할 수 있는 전천후의 눈입니다.

복잡성은 도시에서 나타납니다. 도시 홍수는 "이중 반사"라 불리는 현상을 일으킵니다 — 레이더가 수면에 부딪히고, 건물 벽에 튕겨 나온 뒤, 높은 강도로 위성에 되돌아오는 것입니다. 단순한 알고리즘에게 이것은 마른 땅처럼 보입니다. 도시 침수를 올바르게 식별하려면 이러한 간섭 패턴에 대해 특별히 훈련된 딥러닝 모델이 필요합니다. 전통적인 임계값 기반 접근법은 여기서 일관되게 실패합니다.

SAR을 광학 데이터와 융합하면 — 전천후 커버리지에는 레이더를, 분광학적 확인에는 광학 이미지를 사용하면 — 복잡한 도시 경관에서도 분류 정확도가 92%를 넘습니다.

왜 표준 AI는 그냥 홍수를 예측할 수 없는가?

이것은 제가 끊임없이 받는 질문인데, 이 질문은 머신러닝이 무엇을 할 수 있고 무엇을 할 수 없는지에 대한 근본적인 오해를 드러냅니다.

과거 홍수 데이터로 훈련된 표준 딥러닝 모델은 패턴을 학습합니다. 강 근처의 부동산이 더 자주 침수된다는 것, 특정 토양 유형이 더 큰 손실과 상관관계가 있다는 것, 가을보다 봄이 더 나쁘다는 것을 학습할 수 있습니다. 그리고 훈련 데이터와 비슷하게 생긴 사건에 대해서는 상당히 잘 작동합니다.

하지만 홍수는 역사적 선례가 전혀 없는 방식으로 악화되고 있습니다. 순전히 데이터 기반인 모델은 한 번도 본 적 없는 폭풍 강도를 맞닥뜨리면, 무모하게 외삽하거나 보수적이고 잘못된 값으로 회귀해 버립니다. 더 나쁘게는, 물리적으로 불가능한 예측을 만들어낼 수도 있습니다 — 근원 없이 나타나는 물, 또는 오르막으로 흐르는 물처럼 말입니다.

500년 폭풍을 한 번도 본 적 없는 신경망은 그것을 맞닥뜨리면 환각을 일으킵니다. 물리학은 환각을 일으키지 않습니다.

이것이 바로물리 정보 신경망(Physics-Informed Neural Networks) — PINN — 이 홍수 모델링에서 가장 중요한 아키텍처적 진보를 나타내는 이유입니다. PINN은 단지 과거 데이터에 맞도록 훈련되지 않습니다. 그것은 동시에 유체 역학의 법칙을 따르도록 훈련됩니다: 질량 보존(물은 아무 데서나 나타나지 않는다)과 운동량 보존(물은 중력과 마찰을 따라 내리막으로 흐른다)입니다.

그 기술적 구현은 개념상으로는 의외로 단순합니다. 신경망의 손실 함수에는 두 가지 구성 요소가 있습니다: 관측된 데이터와 얼마나 잘 맞는지, 그리고 지배 물리 방정식을 얼마나 심하게 위반하는지입니다. 훈련 중에 물리 위반에 벌점을 주면, 데이터에 근거하면서도 물리적으로 제약된 모델을 얻게 됩니다.

실질적인 이득은 막대합니다. PINN은 물리 방정식이 해 공간을 제약하기 때문에 훨씬 적은 훈련 데이터를 필요로 합니다. 그리고 기저의 물리학이 변하지 않기 때문에 전례 없는 사건에도 일반화됩니다 — 500년 폭풍은 10년 폭풍과 동일한 유체 역학을 따르며, 다만 입력값만 다를 뿐입니다.

이러한아키텍처들이 어떻게 함께 작동하는지에 대한 전체 기술적 분석은, 수문학적 경로 계산을 위한 그래프 신경망(Graph Neural Networks)의 수학을 포함하여, 저희 연구 논문을 참고하시길 권합니다. 하지만 언더라이팅에 있어 핵심 통찰은 이것입니다: 대리 모델(surrogate model)로 훈련된 PINN은 특정 부동산에 대해 수천 개의 기후 시나리오를 실시간으로 시뮬레이션할 수 있습니다. 정적인 "Zone AE" 요율 대신, 그 특정 경관을 통과해 그 특정 건물로 흐르는 물의 실제 물리학을 반영하는 동적이고 확률적인 위험 프로파일을 얻게 됩니다.

지급 능력에 관한 논거

저는 지금까지 기술적 논거를 펼쳐왔지만, 이제 사업적 논거를 펼쳐 보겠습니다. 왜냐하면 시급성이 자리 잡고 있는 곳이 바로 여기이기 때문입니다.

주택 소유자 보험의 합산비율(combined ratio) — 보험사가 언더라이팅에서 돈을 벌고 있는지 잃고 있는지를 나타내는 기본 지표 — 은 최근 평균 101.5%를 기록했고, 최고2023년 110.5%까지 치솟았습니다. 100%를 넘는다는 것은 돈을 잃고 있다는 뜻입니다. 업계는 출혈하고 있습니다.

역선택이 보험사들을 산 채로 잡아먹고 있습니다. 홍수 위험을 우편번호 수준에서 산정하면, 언덕 위의 집과 저지대의 집을 함께 평균 내게 됩니다. 저지대의 주택 소유자 — 폭우가 올 때마다 지하실이 침수된다는 것을 아는 사람 — 는 평균 가격에 열심히 가입합니다. 언덕 위의 주택 소유자는, 그 가격이 자신의 실제 위험에 비해 너무 비싸다는 것을 올바르게 인식하고 떠나버립니다. 당신의 위험 풀은 조용히 나쁜 위험들로 집중되고, 손해율은 다음 대형 사건이 있기 전까지 드러나지 않는 방식으로 악화됩니다.

Deep AI는 이 역학을 뒤집습니다. "고위험" 구역에 있는 주택이 실제로는 기준 홍수 고도보다 1.2미터 위에 있고, 홍수 통풍구가 설치되어 있으며, 고지대에 설치된 HVAC 시스템을 갖추고 있다는 것을 아는 보험사는, 기존 경쟁사들이 손대지 않을 요율로 그 계약을 수익성 있게 인수할 수 있습니다. 그것은 체리피킹이 아닙니다 — 정확한 가격 책정입니다. 그리고 그것은 양방향으로 작동합니다: 반지하 차고와 사방이 불투수면으로 둘러싸인 "저위험" 구역의 주택은 실제 그대로의 위험에 맞춰 가격이 책정됩니다.

1980년대 종이 지도와 우편번호 평균값에 기반해 홍수 위험을 인수하던 시대는 사실상 끝났습니다. 문제는 어느 보험사가 이것을 가장 먼저 인식하느냐입니다.

여기에는 재보험의 측면도 있습니다. 재보험사 — 보험사를 보험하는 회사들 — 는 원수보험사의 기저 포트폴리오에 대한 투명성을 점점 더 요구하고 있습니다. 픽셀 단위 고도 데이터로 인수되고 위성 레이더로 모니터링되는 계약 집합은, FEMA 구역으로 가격이 책정된 것과는 근본적으로 다른 위험 제안입니다. 더 나은 데이터는 더 나은 재보험 조건을 의미하고, 이는 더 나은 자본 효율성을 의미하며, 이는 곧 경쟁 우위를 의미합니다. 그것은 복리로 불어납니다.

"하지만 그걸 규제 당국에 설명할 수 있나요?"

사람들은 늘 제게 이것을 묻는데, 옳은 질문입니다. AI가 누군가 자기 집에서 계속 살 수 있느냐를 좌우하는 가격 책정 결정의 중심이 되면서, 규제 당국의 감시는 강화될 것이며 — 또 강화되어야 합니다.

이것은 사실 물리 정보 기반 모델이 블랙박스 딥러닝보다 예상 밖의 이점을 갖는 지점입니다. PINN의 예측은 명시적인 물리 방정식 — 유체 역학의 생브낭 방정식(Saint-Venant equations), 질량 보존, 운동량 보존 — 에 근거합니다. 주 보험감독국이 보험료가 왜 인상되었는지 물으면, 보험사는 구체적이고 물리적으로 모델링된 수리학적 위험을 짚어 보일 수 있습니다: "이 분수령에서 온 물이, 이 고도 측정값과 이 배수 위상 구조에 근거하여, 이러한 강우 조건 하에서 이 부동산에 이 깊이로 도달합니다."

그것은 불투명한 알고리즘적 상관관계가 아닙니다. 그것은 공학입니다. 규제 당국은 공학을 이해합니다.

저는 이것을 "글래스 박스 AI(Glass Box AI)"라고 부르기 시작했습니다 — 그 추론이 단지 학습된 통계적 패턴이 아니라 알려진 물리학에 뿌리내리고 있기 때문에 투명한 모델을 말합니다. 그것은 고위험 결정에서 AI에 대해 모두를 불안하게 만드는 블랙박스 문제의 정반대입니다.

이것이 다음으로 향하는 곳

제가 가장 매력적이라고 — 그리고 가장 파괴적이라고 — 느끼는 개념은, 제가 "살아있는" 위험 모델이라고 부를 만한 것입니다. 오늘날 홍수 위험은 보험 가입 시점에 평가되고 아마 갱신 시에나 다시 검토됩니다. 그것은 스냅숏입니다. 하지만 위험은 연속적입니다.

SAR 위성이 한 지역에서 지반 침하를 탐지하면, 영향을 받는 부동산의 위험 점수가 갱신되어야 합니다. 이웃이 투수성 잔디밭을 포장해 덮어버리면, 전체 미세 분수령의 지표 유출 특성이 변합니다. 지자체가 빗물 배수관을 개량하면, 그 배수 유역의 모든 부동산이 혜택을 봅니다.

살아있는 모델은 보험사를 보험금 지급자에서 위험 파트너에 더 가까운 무언가로 변모시킵니다. 기간 중 조정. 선제적 경보. 보험사가 항공 이미지를 통해 실제로 검증할 수 있는 완화 조치 — 설치된 홍수 통풍구, 고지대로 올린 HVAC, 유지되는 투수성 표면 — 에 대한 보험료 크레딧.

이것은 또한 홍수에 대한 파라메트릭 보험도 가능하게 합니다 — 위성이 피보험 좌표에서 홍수 깊이가 임계값을 초과함을 확인할 때 자동으로 지급되는 보험입니다. 손해사정인의 방문도 없습니다. 몇 달에 걸친 청구 절차도 없습니다. 사람들이 가장 필요로 할 때 즉각적인 유동성이 제공됩니다.

저는 벽에 1992년 지도를 붙여 둔 그 언더라이터를 계속 생각합니다. 그가 문제는 아니었습니다. 그는 업계가 그에게 준 것으로 일하고 있었습니다. 문제는, 기후가 앞으로 나아갔고, 데이터가 앞으로 나아갔으며, 기술이 앞으로 나아갔음을 — 언더라이팅 인프라가 벽에 압정으로 고정된 채 머물러 있는 동안 — 업계가 인식하는 데 느렸다는 것입니다.

컴퓨터 비전, 합성개구레이더, 그리고 물리 정보 기반 머신러닝의 융합은 단지 홍수 언더라이팅을 개선하는 데 그치지 않습니다. 그것은 홍수 언더라이팅을 처음으로 가능하게 만듭니다. 그 이전의 모든 것은 의미를 갖기에는 너무 거친 해상도에서 하는 유식한 어림짐작이었습니다. 다음에 오는 것은 측정입니다 — 건물 하나하나, 30센티미터 하나하나, 폭풍 하나하나 — 홍수 위험을 예측 불가능한 재앙에서 당신이 실제로 가격을 매길 수 있는 무언가로 바꾸는 정밀도로 말입니다.

이것을 가장 먼저 파악하는 보험사들은 단지 더 나은 손해율을 갖게 되는 데 그치지 않을 것입니다. 그들은 말이 되는 유일한 손해율을 갖게 될 것입니다.

Related Research

Also Published On