빅데이터로 '빅'해진 우버

우버(Uber)는 '택시'를 부르는 스마트폰 앱으로, 카카오택시와 비슷합니다. 에어비앤비와 더불어 공유경제 스타트업의 대표주자입니다. (공유경제란 스마트폰 등 디지털 기술의 발달로 과거 상업적으로 활용되지 않는 부분에서 수익을 창출하는 경제활동을 일컫습니다.) 우버와 카카오택시의 가장 큰 차이점은 택시운송사업조합과의 관계입니다. 카카오택시는 택시운송사업조합과 계약을 맺었습니다. 즉, 카카오택시는 '기존 택시운전사'를 카카오택시 이용객이 스마트폰 앱으로 부를 수 있게 하는 중간매개자입니다.

반면 우버는 운전면허증과 차를 소유한 사람 중 우버 신원조사를 통과한 사람과 계약을 맺습니다. 기존 택시운전사도, 아르바이트 거리를 구하는 학생도, 소일거리를 찾는 주보도 우버 운전사가 될 수 있습니다. 우버 차는 사실 영업허가 받은 '택시'가 아닌 거죠. 우버 이용객들은 우버로 '택시'를 부르는 게 아니라 '민간인 차'를 부르는 거지만, 이 글에서는 편의상 우버 택시라고 하겠습니다. 

Uber's Gross Bookings 소스: Bloomberg연별 우버 승객의 이용액 총합 소스: Bloomberg

우버는 사용의 편리성과 신속성으로 대중에게 큰 인기를 얻습니다. 매달 4천만 명이 우버를 사용한다고 우버 CEO 트래비스 캘러닉(Travis Kalanick)이 2016년 10월 19일 공식적으로 밝힙니다. (우버는 비상장 회사라 모든 수치를 공개하지 않습니다) 우버가 대중화되면서 우버 택시를 영어로 그냥 'Uber'라고 부릅니다. 'Get an Uber.' '저거 검색해봐라'고 할 때 'Google that.'이라고 하는 것처럼요.)


우버는 스마트폰 앱을 열어 버튼 하나만 누르면 택시를 바로 부를 수 있어서 편리합니다. 2009년 파리에서 택시를 부르기가 힘들어 착안된 우버의 편리성은 당시에는 획기적이었습니다. 하지만 이제는 택시를 부르는 다른 앱도 많습니다. 그러나 벤처 투자자들은 스타트업 우버의 가치를 690억달러(69조원)로 평가하고 투자합니다. 우버의 평가 가치액이 높은 이유는 우버가 무서울 정도로 빅데이터를 활용하기 때문이죠. 우버도 이걸 압니다. 그래서 빅데이터에 사활을 겁니다. 


빅데이터로 잽싸진 우버


지금은 경쟁 택시 앱이 없었던 2009년이 아닙니다. 우버는 우버 택시와 승객이 연결되는 시간을 단 0.1초라도 줄이려고 노력을 합니다. 우버는 우버 택시 운전자의 GPS를 통해 운전자의 위치는 물론이고, 실시간 주행속도, 브레이크 밟는 횟수 등 생각할 수 있는 데이터란 데이터는 다 모읍니다. 

우버 택시 승객의 GPS도 수집합니다. 승객이 택시를 요청한 순간부터, 택시에서 내리고 5분후까지(!)의 데이터를 수집합니다. (5분 후까지라고 우버는 이야기하지만 우버 앱은 기술적으로는 24시간 내내 승객 GPS를 추적할수있습니다... '우버의 사건·사고로 인해 눈덩이처럼 쌓인 승객들의 분노'는 글 조금 뒤에 등장합니다) 우버는 승객 위치를 이렇게 자세히 파악해야 되는 이유로 다음 4가지를 듭니다. 

승객이 더 빨리 택시를 잡을 수 있습니다.
승객이 더 나은 고객 서비스를 받을 수 있습니다.
승객이 더 안전해집니다.
승객에 대한 사기를 예방할 수 있습니다. (어떤 택시 운전사는 승객 하차 이후에도 몇 초간 승객이 타고 있는 것처럼 행동하여 배를 불립니다)

한마디로 우버 승객을 위한 조치입니다.(우버 택시 운전자에게는 이렇게 친절하게 설명해주지도 않습니다. ㅋㅋ)

마우스 드래그로 실시간으로 우버 출발지와 도착지를 한눈에 볼수있습니다. 소스: Uber마우스 드래그로 실시간으로 우버 출발지와 도착지를 한눈에 볼수있습니다. 소스: Uber

우버는 이렇게 매일 수십억 개에 달하는 GPS 데이터를 수집합니다. 운전자와 승객의 위치를 파악하는 것을 맵핑(mapping)이라고 부릅니다. 운전자와 승객의 연결해주는 것을 라우팅(routing)이라 부릅니다. 우버는 맵핑으로 얻은 데이터로 라우팅 기술을 향상시켜 우버 운전자와 우버 승객의 매칭 속도를 최소화합니다. 승객은 빠른 우버 택시를 자주 이용하게 되고, 승객이 많아지면 운전사를 영입하기 쉬워집니다. 즉, 빅데이터로 얻는 우버의 신속성은 우버의 수익(아니면 손실)으로 직결됩니다.


빅데이터로 아이디어 얻은 우버

우버는 빅데이터로 우버 택시 대기시간을 줄이는 것뿐만 아니라 새로운 상품을 개발하기도 합니다. 우버풀(UberPool) 서비스는 빅데이터의 결과입니다. 우버풀은 같은 방향으로 향하는 다른 사람을 태워주는 서비스입니다. 

우버풀 설명 그림 by 빌 걸리우버풀 설명 그림 by 빌 걸리


초창기 우버는 고급 승용차와 리무진만을 취급하는 앱이었습니다. 그러나 우버가 뉴욕 우버 데이터를 관찰한 결과, 우버 승객의 출발과 도착지가 비슷한 시간에, 비슷한 지역에서 이루어지고 있다는 것을 발견합니다. 효율성이 높은 우버풀 도입으로 우버는 더 낮은 택시 가격으로 승객을, 더 높은 수익으로 운전자를 모읍니다. 우버풀 도입을 '우버의 운명적인 결정'이라고 유명한 벤처 투자자이자 우버 이사 빌 걸리(Bill Gurley)가 일컫습니다. 


가격을 정하는 우버의 빅데이터


우버가 도입한 택시가격변등제는 빅데이터 활용의 극적인 예입니다. 우버는 도로 교통 상황과 택시 공급 및 수요에 따라 우버 가격을 실시간으로 정합니다. 공급이 많고 수요가 적을 때는 택시 가격이 싸지고, 반대로 공급이 적고 수요가 많을 때는 택시 가격이 비싸집니다. 


호텔과 비행기 등 기존 회사가 주말이나 공휴일, 비수기냐 성수기냐에 따라 가격을 책정하고 있었습니다. 우버에서는 실시간 예측 모델링을 통해 라이브로 가격이 책정됩니다. 이를 우버에서는 "Geosurge(지역파도)"라고 부릅니다. 공식적인 이름은 다이내믹 프라이싱(dynamic pricing)입니다. 우버는 다이내믹 프라이싱에 대한 특허권을 소유합니다.


맨날 만원주고 가던 거리를 5만원주고 가야되면 승객은 짜증이 납니다. 우버도 단기적으로는 승객이 가격 상승에 대해 불만을 갖게 될 것이라고 인정합니다. 눈 내린 2011년 12월 31일 뉴욕에서 3만7천원하던 1.6km 거리 택시비가 13만 5천원으로 뛰어 화제(논란)이 된적도 있습니다. 하지만 우버는 (빅데이터를 통해 판단한 결과) 장기적으로 운전자와 승객 모두 만족할 것이라 믿습니다. 

기본적인 수요와 공급의 법칙입니다. 높아진 가격에 숨어있던 운전자가 나와 공급이 늘어날 것이라는 겁니다. 더욱더 많은 운전자에게 빛을 쫴주기 위해 우버는 기계학습 알고리즘을 이용합니다. 각 도시의 매니저와 운전자에게 그 지역의 수요와 공급을 한눈에 보여주는 열지도(heatmap)을 제공합니다. 수요가 급등할 것이라고 판단된 지역과 시간에 운전자가 그 시간에 그 지역으로 가도록 우버는 장려합니다. 따라서 승객은 '택시가 없는 날' 택시를 일반 가격으로 이용할 수 있고, 운전자는 시간당 수익을 극대화할 수 있습니다. 운전사 수익에서 수수료를 챙기는 우버도 이익입니다.

우버 매니저와 운전자에게 제공되는 열지도(Heatmap) by Uber우버 매니저와 운전자에게 제공되는 열지도(Heatmap) by Uber



빅데이터의 좋은 예


도시 계획가 및 공무원들은 "Movement(진전)"이라는 웹사이트에서 우버가 수집한 교통 정보를 공부할 수 있습니다. 우버는 빅데이터를 통해 우버 택시의 효율성을 높였듯이, 빅데이터로 대중교통의 효율성도 증진하려고 합니다. ('우버가 공개한 교통 정보는 사용자 정보를 익명화하여 프라이버시를 보장합니다.'라고 우버가 이야기합니다) 

도로의 폐쇄, 대형 이벤트, 도시 행사에 따른 도시 도로 교통 변화를 한눈에 파악해 도시 교통 시설을 개선하도록 도와줍니다. 도시 교통이 잘 빠지면, 더 저렴한 가격으로 짧은 시간에 이동할 수 있는 우버 승객도, 더 효율적으로 일해 시간 대비 이익을 더 높게 얻을 수 있는 우버 운전사도 이득입니다. 

우버풀 도입 전과 후 비교 교통체증 비교 그래픽 by Uber우버풀 도입 전과 후 교통체증 비교 by Uber

또한, 정부 기관에서 우버 영업 승인을 받아야 하는 우버로서는 정부 기관과 협조하는 게 나쁘지 않습니다. (다만, 이러면서 우버를 조사하려는 공무원을 불법적으로 쫓아 문제가 생길 뿐입니다.)


빅데이터의 나쁜예 1) 정부의 감시를 피해서

VTOS("violation of terms of service")는 데이터를 통해 "우버를 비적절하게" 사용하는 사람을 차단하는 우버 비밀 프로젝트였습니다. 최소 2014년부터 시작되었다고 보고되는 VTOS는 정부 관계자와 애플을 따돌리려 사용하다 (두 차례에 걸쳐) 적발됩니다. "Geofence(지역쉴드)" 및 "Greyballing(침바르기)", "Fingerprinting(지문찍기)" 등이 현재까지 VTOS의 일환으로 실행된 방법입니다. 

우버는 법망을 피하려고 VTOS 프로젝트를 지난 몇 년간 전 세계적으로 운영합니다. 한국 및 중국, 호주, 프랑스, 미국 등의 감사관을 모두 따돌립니다. 우버가 운영되는 여러 지역에서 사실 우버가 불법이기 때문입니다. 정부가 기존택시조합의 로비를 받아 우버 허가를 안 해주는 지역도 있고, 우버의 운전자 승낙 기준이 너무 낮다고 허가를 안 해주는 지역도 있습니다.

우버 입장에서는 많은 운전자를 얻으면 얻을수록 좋으니 민간인 운전자 신원 조사를 빡쎄게 할 이유가 없다는 거죠. 한국에서의 경우 우버는 한국에서 영업해도 되지만 한국인을 태우면 불법입니다. (ㅋㅋㅋ 한국에서 외국인을 찾아 영업해야 합니다.)

우버가 불법으로 영업하다 걸리면 대게 운전자의 차를 압수당하고 우버 운전자는 벌금을 물어야됩니다. 우버는 이 비용을 자신이 책임지겠다고하며 유리 심장 운전자를 모집했기때문에 이 비용은 전부 우버 책임입니다. 적발 건당 수천달러(수백만원)로 추정되는 비용은 덩치 큰 우버에게도 부담입니다. 

적발을 피하는 방책으로 우버가 시행한게 "지역쉴드"과 "침바르기"입니다. "지역쉴드"는 어떤 특정 건물 주변에서 앱을 사용할경우 일반 앱 대신 가짜앱을 보여주는 프로젝트입니다. 우버가 불법인 지역 정부 건물을 우버가 "지역쉴드"했습니다. 일단 정부 건물 안과 그 주변에서 나온 우버 앱 데이터를 따로 관찰하고 관리했습니다. 우버 앱을 정부 건물에서 열어보았는지, 얼마나 열어보았는지, 언제 열어보았는지 파악했습니다. 그리고 의심가는 이용자에 "침바르기"를 했습니다. 

"침바르기" 활동은 SNS에서 우버 조사관을 알아보는 일, 우버앱 결제 신용카드가 정부관련인지 알아보는 일, 정부 건물 주변 제일 싼 스마트폰 시리얼 넘버를 확인하는 등 아주 다양하고 치밀합니다. 이런 무서운 과정을 통해 "지역쉴드"로 설정된 경우, 우버 앱을 열어도 가짜 앱이 나옵니다. 가짜 앱에서는 실제 운행중인 택시도 보이지 않고 가짜앱의 이용자의 탑승 요청은 언제나 거잘당합니다. :) 

이 사실이 뉴욕타임스에 밝혀지자 2017년 5월 미국 법무부가 우버에 대한 범죄 조사를 시작했습니다. 현재 진행중입니다.


빅데이터의 나쁜예 2) 애플의 정책을 피해서

VTOS 비밀 프로젝트로 우버는 애플과도 마찰을 빚습니다. "지문찍기" 기술로 우버는 애플 아이폰에서 우버앱 재설치 고객과 신규설치 고객을 구분합니다. 즉, 아이폰에서 우버앱을 삭제해도 우버앱 설치 기록이 남도록 하는 기술입니다. 

"지문찍기" 기술은 중국에서 신규설치 고객 프로모션을 악용하는 사람들을 막기위함이었습니다. 그러나 "지문찍기"는 애플 앱스토어 프라이버시 정책에 반합니다. 이에 우버는 애플 캘리포니아 본사를 "지역쉴드"합니다. ㅋㅋㅋ  애플 본사 기술자들에게는 "지문찍기" 코드가 없는 앱을 보여주는 것입니다. 그러나 우버는 캘리포니아 밖에도 애플 직원이 존재한다는걸 깜빡합니다. 

애플 CEO 팀 쿡이 2015년 초에 우버 CEO 캘러닉을 애플 본사로 부릅니다. 애플 앱스토어 정책에 따르지 않으면 우버는 앱스토어에서 판매금지조치를 당할 것이라고 엄포합니다. 캘러닉은 결국 팀 쿡의 말에 따르고 "지문찍기'를 그만둡니다. 

(후에 애플은 프라이버시를 침해하지 않는 선에서 신규설치 프로모션을 악용하지 못하는 기술을 개발해 모든 앱스토어 개발자들이 이용하도록 합니다. 우버가 신규설치 프로모션을 악용하는 사람들을 막는 것은 타당하지만, 애플에 먼저 가서 이야기하지 않고 스스로 뒷길로 처리해버린 우버 CEO 캘러닉과 부하직원의 문화를 알려주는 일화입니다.)


누구를 위한 빅데이터? 데이터 뒤, 사람 1) 프라이버시

2011년 벤처 투자자 피터 심스(Peter Sims)가 우버가 자신의 위치정보를 파티에서 공개했다는 블로그글을 올렸습니다. 뉴욕 맨하튼에서 우버를 타고 있는데 잘 알지 못하는 사람에게 문자가 왔습니다. "너 맨하튼 거기에있지?" 알고보니 우버 시카고 진출기념 파티에서 자신의 실시간 위치정보를 대형화면에 띄어놨던 것입니다. 

승객의 실시간 위치정보를 우버 내에서는 "God's View(신의 전망)"이라고 불렀습니다. 우버 전직원이 "신의 전망"에 너무나 쉽게 접근할수 있어 프라이버시 논란이 일어납니다. 

2014년에 버즈피드 기자가 자신의 위치정보를 남용한 우버 뉴욕 사무실 부장 이야기를 보도합니다. 인터뷰하러오는 버즈피드 기자가 우버에서 내리자 우버 뉴욕 부장이 "너 딱 맞춰왔네. 나 너 보고 있었어."라고 말합니다. 

이외에도 우버가 면접 문제로 실제 GPS 추척 데이터를 이용한 경우도 있습니다. 그러니 2016년 우버가 승객의 편리함을 위해 승객의 위치를 우버 하차 후 5분까지 추적한다는 이야기에 반발이 일어납니다. 


누구를 위한 빅데이터? 데이터 뒤, 사람 2) 직원

2017년 2월 20일 전직 우버 엔지니어 수잔 파울러(Susan Fowler)가 우버에서 겪은 이야기(고충)를 블로그에 올립니다. 그전까지 우버 기업 문화가 "왕좌의 게임"과 비교를 당할 정도로 우버는 우버 확장 말고는 아무것도 신경 안 쓴다는 걸로 이미 유명했습니다. 우버 CEO 캘러닉이 여자친구와 우버 간부들과 함께 한국 유흥업소를 방문했다고 알려지기도 합니다. 

그러나 담담히 적은 파울러의 글이 파문을 일으킵니다. 파울러는 직속 매니저에게 잠자리를 권유받았고, 이를 인사부에 항의하자 그 매니저는 "능력자"니 해고할 수 없다, 항의를 그만두라고 인사부가 말합니다. 인사부에 자신에 대해 항의했다는 것을 안 매니저는 파울러를 협박합니다. 이러한 사실을 우버 CEO 캘러닉과 CTO 및 고위 간부들도 다 알면서도 내버려 둔 게 밝혀집니다. 

우버는 전직 법무부 장관을 고용해 우버 내 성추행 혐의를 조사합니다. 20명이 넘는 우버 직원이 해고당하며 여러 고위 간부가 우버를 떠납니다. 우버 CEO 캘러닉도 이사회의 요구에 자신이 세운 회사 CEO직에서 2017년 6월 20일 결국 사퇴합니다. 


계속되는 빅데이터의 싸움, 무인자동차

via GIPHY


무인 자동차는 자동차에 달린 센서와 카메라를 통해 수집한 방대한 정보를 실시간으로 판단하는 기술로 실현됩니다. 자동차 위치 및 속도, 방향, 브레이크, 도로 교통 정보, 행인과 자동차의 거리, 갑작스러운 물체 등 빅데이터와 기계학습을 통해 자동차 판단 소프트웨어를 개발해야 하는 것입니다. 무인자동차에 관련된 빅데이터 산업이 2030년에는 7억5천달러(7500억원)에 이를 것이라고 매켄지&컴퍼니가 예상합니다. 


(처음에는 'driverless car(무인자동차)'라고 지어졌지만, 무인자동차로 직업을 잃게 될 택시 및 트럭 운전사들을 생각해서 이름을 바꿉니다. 'self-driving car'로. 말 그대로 '자동 차' 입니다. 무인자동차기술이 개발되면 자동차가 드디어 이름값을 하겠습니다)


무인자동차가 개발되면 우버는 가격경쟁력을 잃습니다. 빅데이터를 통해 우버 운전자의 효율성을 아무리 증대해도, 운전자 없는 비용보다 낮을 수 없기 때문이죠. 그래서 우버는 피츠버그에 있는 카네기 멜런 연구소와 함께 지도를 개발합니다. (후에 카네기 멜런 연구소 사람들을 다 뽑아 가서 멜론 연구소가 화를 냅니다.) 


전직 구글 출신 앤서니 러밴도우스키(Anthony Levandowski)가 설립한 무인자동차 개발회사 Otto를 6억800만달러(6800억원) 주고 삽니다. (러밴도우스키가 구글의 독점기술을 훔쳐갔다고 구글이 우버와 러밴도우스키를 고소합니다. 우버는 Otto로 얻은 기술의 사용을 중단하라는 판사의 명령을 받았고, 러밴도우스키는 우버에서 잘립니다. 현재 소송이 진행중입니다.) 


우버가 법정 공방과 기업 문화로 인한 잇다른 임원 사임으로 정신이 뺏긴 사이, 테슬라는 2015년 테슬라 자동차 6만 대에 무인운전기술을 업데이트합니다. 2014년도 테슬라 자동차에 카메라와 센서를 달고 빅데이터로 테슬라 소프트웨어를 똑똑하게 훈련한 겁니다. 자동차 회사 포드(Ford)도 포드 자동차 400만대에 센서를 설치하는 등, GM, BMW 모든 자동차 회사가 전력을 다해 무인자동차 개발에 박차를 가하고 있습니다. 누가 무인자동차를 실현할지는 미지수입니다.



빅데이터의 능력 vs 사람 마음

잇따른 사건 사고에 우버 고객을 사용하지 않겠다는 사람들이 생겨납니다. '#DeleteUber'가 트위터에서 트랜팅되기도 합니다. 그러나 우버는 빅데이터(많은 운전자 수)를 활용해 엄청나게 복잡하고 정교한 라우팅 기술을 갖고 있습니다. 앱의 인기도를 측정하는 앱애니(App Annie)에 따르면 우버 논란이 보고되면 잠깐 다운로드 및 이용 횟수가 줄지만, 곧 우버는 원상태를 회복한다고 합니다. 오히려 논란으로 앱 삭제 운동이 분 1월 후, 2월에 우버 다운로드가 평상시보다 더 많았다고 합니다. 특히 우버 경쟁자 리프트(Lyft)와 운전자 수가 차이가 크게 나는 지역에서 우버는 논란에 거의 영향을 받지 않습니다. 소비자들이 우버의 행동을 탐탁지 않게 여겨도 당장 택시를 싸고 빠르게 타고 싶기 때문이죠. 앞으로 우버가 무인자동차 기술에 뒤처지지 않는다면, 라우팅 기술이 없는 다른 자동차 회사보다 우위를 점할 수 있습니다. 빅데이터는 이제 겨우 시작입니다. 


+ Recent posts