히트 클러스터링
본 문서에서는 검출기 데이터 분석 과정 중의 히트 클러스터링에 대해 다룹니다.
개괄
히트 클러스터링은 검출기로부터 측정된 원초데이터(raw data)를 1차 분석하는 과정으로서, 이를 통해 여러 의미 있는 물리적 정보를 추출하는 과정입니다. 히트 클러스터링을 하여 물리적 정보를 측정하는 과정에 찾아낼 수 있는, 그리고 찾아내고자 하는 물리적 정보는 위치 정보이며, 위치 정보를 추출하는 과정에서 다른 사항에 찾아낼 수 있는 경우도 있습니다.
인접한 히트 찾기
거리 기준
- 거리 (Manhattan-Taxicab Distance)
- 거리 (Euclidean Distance)
- 거리 (Minkowski Distance)
알고리즘
클러스터링에 쓰는 알고리즘은 다음과 같습니다. 이차원 다체 계산(2D n-body simulation)에서 상호작용을 하는 두 입자를 선택하는 알고리즘과 동일합니다.
- Naive:
- Barnes Hut (Quad-Tree):
위치 추정
개의 검출 지점 위치의 좌표로부터 하나의 값 를 구하기 위해 다음 공식을 따르며, 이는 일반적으로 말하는 가중평균(무게중심법)과 같습니다.
성능 측정
이슈
해상도 한계
일부 양자화(Quantize, Digitize)된 데이터가 있는 상태에서 그 표현이 충분히 자세하지 않은 경우가 있습니다. 다음과 같은 실험 배치의 경우 해당 사항이 있을 수 있습니다.
- 이진검출기(on-off 만 존재하여 로 고정)이거나, 의 단계가 충분히 많지 않으면서,
- 검출 지점의 갯수 이 비교적 적은 경우
간접 클러스터링
핫 픽셀
전산 모사
기타 등등
- 트래킹 클러스터
참고
https://github.com/Isaac-Kwon/alpex
https://github.com/Isaac-Kwon/qupid
스트립 클러스터링