안녕하세요, 클로비스입니다. 이번 포스팅에서는 원시적이고 비정형적인 데이터를 저장하여 AI 활용의 기반이 되는 데이터 레이크를 소개해 드리려고 합니다. 데이터 레이크란 무엇인가요? 데이터 레이크는 대량의 데이터를 원본 형태로 저장하는 중앙 저장소 입니다. 다음과 같은 데이터를 수집할 수 있습니다. 소셜 미디어 게시물 이미지 센서 데이터 로그 파일 재무 데이터 IoT 데이터 문서, 이메일, 제품 리뷰 등 모든 종류의 텍스트 데이터 데이터 레이크는 *정형(Structured), *비정형(Unstructured), *반정형(Semi-structured) 데이터를 모두 수집할 수 있습니다. 저장된 데이터는 AI와 머신러닝으로 처리하여 데이터 분석 및 인사이트를 통해 회사가 경쟁 우위를 확보하는 데 사용할 수 있습니다. 실제로 데이터를 선도하는 기업은 고객 확보 및 유지율이 무려 89% 향상되었습니다. *정형 데이터: 미리 정의된 스키마에 따라 저장할 수