728x90
반응형

텍스트분석 3

MinHash(Minimum Hashing)

개요MinHash(Minimum Hashing)는 집합 간 자카드 유사도(Jaccard Similarity)를 빠르게 근사 계산하기 위한 해시 기반 알고리즘입니다. 웹 페이지 중복 제거, 문서 클러스터링, 추천 시스템 등에서 대용량 데이터 간 유사도를 효율적으로 비교할 수 있도록 설계된 경량 알고리즘입니다.1. 개념 및 정의 항목 내용 정의집합 간 유사도를 추정하기 위해 최소 해시값들을 비교하는 확률적 기법목적대용량 집합 비교 시 연산 비용을 줄이고 효율적으로 유사도 추정필요성텍스트, 로그, 사용자 행동 데이터 등 고차원 데이터의 비교 최적화 필요2. 주요 특징특징설명효과자카드 유사도 근사교집합/합집합 비율을 해시값으로 근사연산량 감소서브라인어 알고리즘저장공간 및 계산 시간 최소화빅데이터 환경 최적화로..

Topic 2026.02.06

Cloudflare Workers AI

개요Cloudflare Workers AI는 Cloudflare의 글로벌 엣지 네트워크를 기반으로 AI 모델을 서버리스 환경에서 실행할 수 있는 플랫폼입니다. 이를 통해 AI 인퍼런스를 사용자에게 가장 가까운 위치에서 수행함으로써, 초저지연 응답과 비용 효율적인 AI 서비스 운영을 실현합니다.1. 개념 및 정의Cloudflare Workers AI는 Cloudflare Workers라는 서버리스 런타임에서 제공되는 인공지능 모델 실행 기능입니다. OpenAI, Hugging Face 등에서 제공하는 다양한 프리트레인 모델을 엣지 위치에서 빠르게 실행할 수 있게 설계되어 있습니다.Serverless AI Inference: 인프라 걱정 없이 AI 모델 호출 가능Global Edge Execution: Cl..

Topic 2025.07.03

데이터 분석 기술(Data Analytics Technologies)

개요데이터 분석은 데이터를 통해 의미 있는 패턴, 상관관계, 예측 결과를 도출해내는 핵심 활동입니다. 단순 통계 계산에서부터 머신러닝 기반의 예측 모델, 실시간 시계열 분석, 텍스트 분석까지 그 기술 범위는 매우 넓습니다. 본 글에서는 현대 데이터 분석 환경에서 널리 사용되는 분석 기술과 방법론, 도구, 실무 전략을 통합적으로 정리합니다.1. 데이터 분석이란? 항목 설명 정의데이터셋을 정량적 또는 정성적으로 분석해 의미 있는 인사이트나 결론을 도출하는 행위목적의사결정 지원, 문제 진단, 예측/추론, KPI 개선분석 대상수치형, 범주형, 시계열, 텍스트, 이미지 등 다양한 형태의 데이터분석 기술은 ‘데이터 기반 사고’를 실현하는 핵심 엔진입니다.2. 주요 분석 기법 분류분류기법설명기술 통계평균, 중앙값,..

Topic 2025.04.21
728x90
반응형