본문 바로가기

Database3

[ChromaDB] 임베딩 간 유사도, sklearn 라이브러리와의 차이점? 🔹 1. Chroma Collection Query1) HNSW 작동 방식Chroma는 벡터 데이터베이스입니다.내부적으로 HNSW(approximate nearest neighbor) 알고리즘을 사용합니다.즉, 완벽한 “정확한 계산(exact search)”이 아니라 근사적 탐색(approximate search) 으로 빠르게 가장 유사한 벡터를 찾아줍니다.장점매우 빠름: 수천~수백만 개의 벡터 중에서도 실시간으로 검색 가능.확장성 높음: 대규모 이미지/텍스트 임베딩 저장에 적합.검색 기능 포함: top-N 결과, metadata 필터링, hybrid 검색 등.단점근사값(approximate): HNSW는 탐색 효율을 위해 정확도를 일부 희생.즉, 실제로는 cosine_similarity가 조금 더 높.. 2025. 10. 14.
[ChromaDB] sqlite3, duckdb로 조회하기 docker logs chromadb | tail -n 30==========persist_path: "/data"==========OpenTelemetry is not enabled because it is missing from the config.thread 'tokio-runtime-worker' panicked at /chroma/rust/sysdb/src/sysdb.rs:175:33:not implementednote: run with `RUST_BACKTRACE=1` environment variable to display a backtrace ((((((((( (((((#### ((((((((((((((((((((((######### .. 2025. 10. 14.
[ORM] 각 언어 기반 ORM 프레임워크 ✅ Java 기반 ORM 프레임워크JPA (Java Persistence API)Hibernate도 JPA의 구현체 중 하나입니다. 다른 JPA 구현체들:EclipseLink: Oracle이 주도, JPA 2.2의 레퍼런스 구현체.OpenJPA: Apache에서 관리하는 구현체.DataNucleus: JDO 및 JPA 지원.MyBatis ORM보다는 SQL Mapper에 가까움. 직접 SQL을 작성하면서 객체 매핑을 일부 자동화해주는 방식. 복잡한 쿼리나 퍼포먼스 튜닝이 필요한 환경에서 선호됨.✅ Python 기반 ORMSQLAlchemy 가장 널리 쓰이는 ORM 중 하나. Declarative 방식과 Core 방식(저수준 SQL 표현)을 모두 지원.Django ORM Django 프레임워크에 내장. .. 2025. 7. 3.