본문 바로가기

시스템/DB

ElasticSearch (Mapping & Analysis) 분석 API 소개때로는 텍스트 분석이라고도 함텍스트 필드/값에 적용 가능문서 인덱스 시 텍스트 값이 분석됨결과는 검색 등에 효율적인 데이터 구조에 저장됨_source 객체는 문서 검색 시 사용되지 않음문서 색인 시 지정된 정확한 값을 포함함문자 필터문자를, 추가, 제거 또는 변경함분석기는 0개 이상의 문자 필터를 포함함문자 필터는 지정된 순서대로 적용됨예시 (html_strip 필터)입력: "I'm in a good mood - and I love açaí!"출력: "I'm in a good mood - and I love açaí!"토큰나이저분석기는 하나의 토큰화기를 포함함문자열을 토큰화함, 즉 토큰으로 분할함토큰화 과정에서 문자가 제거될 수 있음예시입력: "I REALLY like beer!"출력: .. 더보기
ElasticSearch (Mapping Documents) 엘라스틱 서치란- 분산형 검색, 분석 엔진이다.- 확장 데이터 저장, 벡터 DB 역할 가능- 하나의 클러스터에 여러개의 노드가 존재할 수 있다. 인덱스-  샤드 설명- 샤드는 인덱스(ES의 논리적 그룹핑 단위)를 더 작은 조각으로 나누는 방법이다.- 각 조각은 샤드(Shard)라 부른다.- 샤딩은 인덱스 레벨에서 이뤄진다.- 주요 목적은 데이터 볼륨을 가로로(Horizontally) 늘리기(?) 위함이다. - 인덱스가 저장할 수 있는 문서 수를 늘릴 수 있다. 따라서, 노드에 인덱스 수를 늘릴 수 있다.- 각 샤드는 Apache Lucene Index 이다(?)- ES 인덱스는 하나 이상의 Apache Lucene Indices 이다.- 샤드는 정해진 사이즈가 없으며, Doc이 추가될 수록 증가할 수 있.. 더보기
SELECT 기본 용법 ▣ 기본 문법 SELECT select_expr} [FROM table_references] [WHERE where_condition] [GROUP BY {col_name | expr | position}] [HAVING where_condition] [ORDER BY {col_name | expr | position}] [LIMIT {[offset,] row_count | row_count OFFSET offset}]; SELECT 열_이름 FROM 테이블_이름 WHERE 조건식 GROUP BY 열_이름 HAVING 조건식 ORDER BY 열_이름 LIMIT 숫자 예시) SELECT mem_name, addr FROM member WHERE addr IN('경기', '전남', '경남'); -- OR와 .. 더보기