Minchur Gatsby Blog

DataEngineer Minchur

🔍

Nice to Meet You!

I'm DataEngineer Minchur

#All (45)

#docling (1)

#EasyOCR (1)

#Tesseract (1)

#RapidOCR (1)

#DataLake (2)

#KappaArchitecture (1)

#LambdaArchitecture (1)

#DataWarehouse (2)

#DataLakehouse (1)

#DeltaLake (1)

#DataMart (1)

#Kafka (6)

#spark (1)

#pyspark (1)

#scala (1)

#python (1)

#CS (1)

#Database (1)

#etc (2)

#Secure Coding (4)

#RabbitMQ (3)

#large-scale-system (4)

#Redis (8)

#Spring Boot (2)

#Docker (5)

#회고 (3)

#Gatsby (2)

#Linux (3)

Docling이란??

Docling이란??

Docling이란??

#docling#EasyOCR#Tesseract#RapidOCR

정규화된 JSON/Markdown으로 문서를 변환하는 AI기반 문서 파서 Docling에 대해서 알아보자

DataLake Architecture 설계 Lambda & Kappa Architecture

DataLake Architecture 설계 Lambda & Kappa Architecture

DataLake Architecture 설계 Lambda & Kappa Architecture

#DataLake#KappaArchitecture#LambdaArchitecture

DataLake Architecture 설계중 Lambda 방법론과 Kappa 방법론

DataWarehouse, DataLake, DataLakehouse 비교 분석

DataWarehouse, DataLake, DataLakehouse 비교 분석

DataWarehouse, DataLake, DataLakehouse 비교 분석

#DataWarehouse#DataLake#DataLakehouse#DeltaLake

DataWarehouse, DataLake, DataLakehouse의 차이와 장단점, 성능비교

빅데이터 및 분석을 위한 데이터 웨어하우스 설계 방법론 비교

빅데이터 및 분석을 위한 데이터 웨어하우스 설계 방법론 비교

빅데이터 및 분석을 위한 데이터 웨어하우스 설계 방법론 비교

#DataWarehouse#DataMart

논문에 나오는 4가지 주요 데이터 웨어하우스 설계 방법론(Inmon, Kimball, Data Vault, Lambda Architecture)을 중심으로 각 접근법의 핵심 개념, 장단점, 그리고 비교 분석 내용을 중점적으로 정리

ISR과 Replication에 대해서

ISR과 Replication에 대해서

ISR과 Replication에 대해서

Kafka의 고가용성과 내결함성을 보장하는 핵심 매커니즘인 ISR(In-Sync Replicas)과 Replication(복제)에 대해 설명합니다. Replication이란 무엇이며, ISR이 어떤 역할을 하며 왜 중요한지, Kafka 클러스터 운영 시 발생할 수 있는 Replica 불일치 상황, Leader 선출, 데이터 유실 방지 전략까지 함께 다룹니다.

Spark환경에서 Python과 Scala API 성능 비교

Spark환경에서 Python과 Scala API 성능 비교

Spark환경에서 Python과 Scala API 성능 비교

#spark#pyspark#scala#python

Apache Spark는 대규모를 분산처리하는 프레임워크로, 메모리 기반 연산을 통해 Hadoop에 비해 실시간 데이터 처리 성능을 높인 플랫폼이다.

��데이터 마이닝

데이터 마이닝

데이터 마이닝

데이터 마이닝의 개념과 프로세스를 정리하고, K-NN 알고리즘의 원리와 활용 방법을 쉽게 설명합니다. 🚀

정규표현식

정규표현식

정규표현식

정규표현식

ELK란??

ELK란??

ELK란??

ELK란??

Topic, Partition, Segment에 대해서 알아보자

Topic, Partition, Segment에 대해서 알아보자

Topic, Partition, Segment에 대해서 알아보자

Topic, Partition, Segment에 대해서 알아보자

SQL Injection란 무엇일까??

SQL Injection란 무엇일까??

SQL Injection란 무엇일까??

SQL Injection란 무엇일까??

XSS (Cross-Site Scripting)란 무엇일까??

XSS (Cross-Site Scripting)란 무엇일까??

XSS (Cross-Site Scripting)란 무엇일까??

XSS (Cross-Site Scripting)란 무엇일까??

CSRF (Cross-Site Request Forgery)란 무엇일까??

CSRF (Cross-Site Request Forgery)란 무엇일까??

CSRF (Cross-Site Request Forgery)란 무엇일까??

CSRF (Cross-Site Request Forgery)란 무엇일까??

CORS (Cross-Origin Resource Sharing)란 무엇일까??

CORS (Cross-Origin Resource Sharing)란 무엇일까??

CORS (Cross-Origin Resource Sharing)란 무엇일까??

CORS (Cross-Origin Resource Sharing)란 무엇일까??

MSA환경에서 Kafka 실습하기(2)

MSA환경에서 Kafka 실습하기(2)

MSA환경에서 Kafka 실습하기(2)

MSA환경에서 Kafka 실습하기(2)

MSA환경에서 Kafka 실습하기(1)

MSA환경에서 Kafka 실습하기(1)

MSA환경에서 Kafka 실습하기(1)

MSA환경에서 Kafka 실습하기(1)

MSA환경에서 RabbitMQ 실습 (2)

MSA환경에서 RabbitMQ 실습 (2)

MSA환경에서 RabbitMQ 실습 (2)

MSA환경에서 RabbitMQ 실습 (2)

MSA환경에서 RabbitMQ 실습 (1)

MSA환경에서 RabbitMQ 실습 (1)

MSA환경에서 RabbitMQ 실습 (1)

MSA환경에서 RabbitMQ 실습 (1)

RabbitMQ란??

RabbitMQ란??

RabbitMQ란??

RabbitMQ란

Kafka란??

Kafka란??

Kafka란??

Kafka란??

요청 종류에 따른 개발

요청 종류에 따른 개발

요청 종류에 따른 개발

#large-scale-system

읽기 요청 최적화 하는 방법이랑 쓰기 요청 최적화 하는 방법

동시 접속자와 초당 요청량

동시 접속자와 초당 요청량

동시 접속자와 초당 요청량

#large-scale-system

대규모 시스템을 설계할 때 가장 중요한 요소 중 하나는 사용자 수이다.

모니터링과 로깅

모니터링과 로깅

모니터링과 로깅

#large-scale-system

모니터링과 로깅

데이터 일관성 유지 방법

데이터 일관성 유지 방법

데이터 일관성 유지 방법

#large-scale-system

데이터 일관성 유지 방법

모든 API 의 Response Header 에 Server-Port Key로 현재 실행중인 서버의 포트를 추가하기

모든 API 의 Response Header 에 Server-Port Key로 현재 실행중인 서버의 포트를 추가하기

모든 API 의 Response Header 에 Server-Port Key로 현재 실행중인 서버의 포트를 추가하기

모든 API 의 Response Header 에 Server-Port Key로 현재 실행중인 서버의 포트를 추가하기

SpringBoot 프로젝트에 캐싱 적용하기

SpringBoot 프로젝트에 캐싱 적용하기

SpringBoot 프로젝트에 캐싱 적용하기

#Redis#Spring Boot

SpringBoot 프로젝트에 캐싱 적용하기

캐싱 개념과 캐싱 전략

캐싱 개념과 캐싱 전략

캐싱 개념과 캐싱 전략

캐싱 개념과 캐싱 전략

리더보드와 Sorted Set

리더보드와 Sorted Set

리더보드와 Sorted Set

리더보드와 Sorted Set

HttpSession과 Session Clustering

HttpSession과 Session Clustering

HttpSession과 Session Clustering

HttpSession과 Session Clustering

SpringBoot에서 Redis 사용해보기

SpringBoot에서 Redis 사용해보기

SpringBoot에서 Redis 사용해보기

#Redis#Spring Boot

SpringBoot에서 Redis 사용해보기

Redis 타입 및 명령어 살펴보기

Redis 타입 및 명령어 살펴보기

Redis 타입 및 명령어 살펴보기

Redis 타입 및 명령어 살펴보기

Redis Docker로 설치하기

Redis Docker로 설치하기

Redis Docker로 설치하기

Redis Docker로 설치하기

Redis란??

Redis란??

Redis란??

Redis란??

스파르타코딩클럽 JAVA 단기 심화 부트캠프

스파르타코딩클럽 JAVA 단기 심화 부트캠프

스파르타코딩클럽 JAVA 단기 심화 부트캠프

스파르타코딩클럽 JAVA 단기 심화 부트캠프

gatsby-theme-portfolio-minimal 폴더 상세 정리해보기 (2)

gatsby-theme-portfolio-minimal 폴더 상세 정리해보기 (2)

gatsby-theme-portfolio-minimal 폴더 상세 정리해보기 (2)

gatsby-theme-portfolio-minimal 폴더 상세 정리해보기 (2)

Github Blog jekyll에서 Gatsby이전하기(1)

Github Blog jekyll에서 Gatsby이전하기(1)

Github Blog jekyll에서 Gatsby이전하기(1)

Github Blog jekyll에서 Gatsby이전하기(1)

[코멘토 DB직무부트캠프] 1주차 회고

[코멘토 DB직무부트캠프] 1주차 회고

[코멘토 DB직무부트캠프] 1주차 회고

코멘토 DB 직무부트캠프

[코멘토 DB직무부트캠프] 코멘토를 선택하게된 이유

[코멘토 DB직무부트캠프] 코멘토를 선택하게된 이유

[코멘토 DB직무부트캠프] 코멘토를 선택하게된 이유

코멘토 DB 직무부트캠프

Dockerfile이란??

Dockerfile이란??

Dockerfile이란??

Dockerfile을 활용하면 애플리케이션의 실행 환경을 코드로 정의하고 자동화할 수 있다.

Docker 기본명령어

Docker 기본명령어

Docker 기본명령어

Docker의 기본 명령어를 정리하여 컨테이너 및 이미지 관리를 효율적으로 할 수 있도록 한다.

관리자 권한 부여하기

관리자 권한 부여하기

관리자 권한 부여하기

관리자 권한 부여하기

Docker 설치하기

Docker 설치하기

Docker 설치하기

Ubuntu에서 Docker를 설치하는 방법을 단계별로 정리

커널과 셀

커널과 셀

커널과 셀

커널과 셀

멀티부팅이란??

멀티부팅이란??

멀티부팅이란??

멀티부팅이란?

Linux 기초

Linux 기초

Linux 기초

Linux 기초