
※ 4K PTZ 카메라 K6-20BC
PTZ 카메라란 무엇인가?
PTZ 카메라는 추가적인 기구없이 카메라 자체적으로 Pan (좌우회전), Tilt (상하회전), Zoom (확대) 기능이 가능하도록 제작한 카메라 시스템을 뜻한다. 아래의 좌측과 같은 방송용 카메라의 경우 고도로 훈련된 카메라 크루 (Camera Crew)에 의해 운영되므로 수동으로 Pan, Tilt, Zoom을 하게 된다. 하지만 이런 크고 무거우며 매우 비싼 고화질 카메라와 숙달된 운영자를 사용할 수 없는 경우 PTZ 카메라가 좋은 대안이 될 수 있다. 카메라 전문 운영인력이 없어도 될 정도로 조작이 쉽고, 스튜디오 밖이나 혹은 매우 멀리 떨어진 곳에서도 원격으로 카메라를 조작할 수 있기 때문이다. 따라서 PTZ 카메라는 원격중계, 원격촬영, 원격학습, 원격회의, 원격진료 등 다양한 분야에 사용되고 있다.

※ ENG 카메라(출처: Sony) vs PTZ 카메라 (PTZ4U A7-20NT)
PTZ 카메라 구매가이드
모든 제품들이 그렇지만 PTZ 카메라 역시 구매할 때 다양한 스펙들을 검토해서 용도에 맞는 제품을 선택해야 합니다. 최신의 PTZ 카메라에는 여러가지 낯선 용어들이 등장하는데 주요 스펙에 대해 간략하게 설명해 드리겠다.
이미지 센서가 커지면 벌어지는 현상
일반적으로 카메라의 이미지 센서가 커 지면 더 높은 해상도를 지원할 수 있고, 보통 수광 능력도 좋아져 화질 향상에 유리하다. 그래서 촬영 전문가들이나 카메라 매니아들은 점점 더 큰 이미지 센서를 장착한 카메라로 업그레이드하고 싶어 한다. 하지만 이미지 센서가 커지면 당연히 카메라도 커지고 무거워져 기동성이 떨어지고 조작이 어려워져 부가적인 장비를 필요로 하게 된다. 또한 카메라 뿐 아니라 렌즈나 배터리, 삼각대 등 주변기기도 더 크고 비싼 것들을 써야 하기 때문에 더 많은 예산을 필요로 하게 된다.
PTZ 카메라의 경우 최신의 고해상도 제품의 경우 1” 센서나 4/3" 센서를 사용하기도 하지만, 2025년 현재 기준으로 UHD급에는 1/1.8 ~ 1/2.5인치 센서가 많이 사용되고, HD급에는 1/2.5~2.8인치급 센서가 가장 많이 사용되고 있다. PTZ 카메라에 이렇게 작은 센서를 사용하는 것은 팬/틸트/줌이 가능하면서도 충분히 작고 저렴하게 만들기 수 있기 때문이다.

※ 이미지 출처: Wikipedia
카메라의 이미지 센서가 커질 때 달라지는 이런 기본적이고 상식적인 차이 말고, 우리가 종종 놓치는 포인트가 있는데 바로 초점이 맞는 거리 즉 DoF (Depth of Field)라는 개념이다. DoF를 한 마디로 말하자면 초점 (Focus)이 맺히는 거리가 얼마나 긴 지를 뜻하는 것이다. 인물을 촬영할 때 얼굴은 선명하게 나오지만 그 뒤의 배경이 흐릿하게 나오는 경우를 사진이나 영상에서 종종 봤을 것이다. DoF가 약 30 ~ 50cm 정도인 경우라면 인물 뒤의 배경이 아주 멋있게 흐려지며 멋진 느낌을 주게 될 것이다. 반대로 멀고 가까운 여부와 관계없이 모든 피사체들이 선명하게 촬영되었다면 DoF가 매우 긴 경우라 보면 된다.
DoF에 영향을 미치는 요소는 3가지인데, 첫번째가 이미지 센서의 크기이다. 이미지 센서가 클 수록 초점이 맞는 거리가 짧고, 반대로 이미지 센서가 작아지면 초점이 맞는 거리가 상대적으로 길어진다. 즉, 이미지 센서가 작으면 가까이에 있는 피사체나 멀리 있는 피사체나 다 선명하게 촬영된다. 반면에 이미지 센서가 커 질수록 초점이 맞는 거리(DOF)가 짧아져 초점 (Focus)가 잘 맞도록 수동 혹은 자동으로 초점 조절을 잘 해 주어야 한다. 대신 미적인 영상을 만들 수 있다는 장점이 있다.

※ 이미지 출처: PNGegg
DoF에 영향을 미치는 또 다른 2가지 요소는 바로 조리개(Iris) 값과 줌 (Zoom) 배율이다. 조리개를 최대한 개방할수록, 그리고 줌을 최대한 많이 당길수록 초점이 맺히는 거리가 짧아진다. 즉, DoF가 낮아지게 되는 것이다. 반대로 조리개를 더 작게 조일수록, 그리고 줌을 하지 않을수록 (광각일 수록) 초점이 맺히는 거리가 더 길어지게 된다.
예를 들어, 35mm Full Frame 센서가 장착된 캐논 5D 카메라에서 조리개를 최대 개방했을 때의 값이 f.2.8인 24-70mm 줌 렌즈를 장착했다고 가정해 보자. 풍경을 찍을 때는 최대 광각인 24mm (수평 화각 약 74도)에 조리개는 약 f.8 ~ f.11 정도로 조여 줄 것이다. 반면에 인터뷰 사진을 찍고 싶다면 2m 정도의 거리에서 줌은 약 35~50mm 정도로 놓고, 조리개는 최대인 f.2.8까지 개방하고 싶을 것이다. 이 보다 더 느낌 있는 인물 사진을 찍고 싶다면 아마도 조금 더 뒤로 물러선 후 줌을 70mm로 최대한 당긴 상태에서 조리개도 f.2.8로 최대한 개방해서 인물의 뒷배경을 날리고자 할 것이다.

※ 이미지 출처: PNGegg
이렇게 센서가 클수록, 조리개를 많이 개방할수록, 그리고 줌(zoom)을 많이 당길수록 더 예술적인 느낌의 촬영이 가능해진다. 하지만 큰 영화를 촬영할 때에는 카메라의 초점만을 전문적으로 맞춰 주는 포커스 풀러 (Focus Puller)를 따로 고용해야 할 정도로 정확히 초점을 맞추는 것이 어렵다. 영화 촬영에 사용하는 큰 카메라들은 센서도 크고, 전문 렌즈를 사용하여 조리개 개방도 많이 할 수 있기 때문에 인물을 촬영할 때에는 DoF가 매우 짧은 경우가 대부분이기 때문이다. 반대로 이미지 센서가 충분히 작다면 초점을 맞추기 위해 수동조작을 할 필요가 별로 없고, Auto Focus 기능이 있을 경우에도 훨씬 빠르고 정확하게 초점을 잘 잡아 준다.
줌 (Zoom) 배율과 함께 꼭 살펴봐야 할 스펙은?
PTZ 카메라를 선택할 때 보통 해상도와 함께 몇 배 줌 (zoom)을 지원하는 지를 가장 먼저 확인하는게 일반적이다. 팬(Pan)과 틸트(Tilt) 성능도 중요하지만 줌(zoom) 성능이 PTZ 카메라의 활용 범위에 중요한 영향을 미치지 때문이다. 물론 줌 배율이 높을수록 더 비싼 줌 모듈을 채용해야 하기 때문에 당연히 원가도 상승하게 된다.
그런데 PTZ 카메라의 스펙에서 줌 배율만큼 중요한 것이 또 있는데 바로 화각 (Field of View)이다. 같은 20배 줌이라고 하더라도 최대 광각(Wide)일 때의 화각과 최대 망원(Tele)일 때의 화각이 다른 경우가 많다. 중요한 것은 내가 사용하고자 하는 공간의 크기와 피사체들이 배치된 상태를 고려해서 화각을 선택해야 한다는 것이다. 예를 들어, 강의실의 뒷벽에 설치해서 강의실의 전체적인 모습을 모니터링하려고 할 때, 만약 강의실이 가로로 넓거나 부채꼴 모양이라면 70도 이상의 넓은 수평 화각을 가진 PTZ 카메라를 선택해야 한다. 반면에 강사를 전담해서 촬영할 PTZ 카메라의 경우 50 ~ 60도 정도의 화각을 가진 경우가 오히려 낫다. 줌을 많이 하지 않더라도 강사를 적절한 구도와 초점으로 촬영할 수 있기 때문이다.
앞서 설명한 바와 같이 Zoom을 많이 하면 작은 센서의 카메라라 하더라도 배경을 흐려주는 효과가 나타날 수 있다. 따라서 강사를 촬영하는 카메라가 zoom in을 많이 하게 되면 강사 뒤에 있는 칠판이 잘 안 보일 수 있다. 따라서 (칠판을 같이 보여 주어야 하는 경우) 강사 전담 카메라는 너무 멀리 배치해서 zoom을 당기기 보다는 상대적으로 가까이에 놓고 zoom을 최소화하는 것이 유리하다.
예를 들어, 아래와 같은 4K/UHD 해상도의 PTZ 카메라 스펙을 비교해 보자. A7-12NT는 1/2.5인치 센서를 채용하였고, 광학 12배 줌이며, 수평 화각은 약 81도~7.5도이다. 이에 비해 A7-20NT와 A7-20NT-12G는 1/1.8인치 센서를 채용하였고, 광학 20배 줌에 수평 화각은 약 60 ~ 3.5도이다. A7-12NT의 렌즈 스펙을 보면 초점거리는 f=3.47 ~ 41.65mm라고 표기되어 있는데, 이는 zoom을 하지 않는 최대 광각일 때 초점거리가 3.47mm이고 최대 망원일 때가 41.65mm라는 뜻이다.
참고로, 이 초점거리는 센서 사이즈에 따라 실제 보여지는 화각이 다르기 때문에 (일반 카메라의 경우) 보통 35mm Full Frame 센서의 초점거리로 환산한 값을 같이 표기해 준다. 일반적으로 PTZ 카메라의 경우 이 초점거리의 변화로 인한 구도의 차이를 보다 직관적으로 알 수 있도록 화각 (Field of View)을 같이 표기해 주고 있다.

이렇게 수평 화각으로 표기해 주어도 감이 잘 안 오는 분들이 많을 텐데, 보통 인물 촬영을 할 때 (Full Frame 센서 기준으로) 35mm나 50mm 단렌즈를 많이 사용한다. 이 때의 수평 화각이 각각 대략 54.4도와 39.6도이다. 따라서 이 PTZ 카메라의 최대 광각인 60도는 (Full Frame 센서의 카메라에서) 35mm 렌즈를 장착했을 때보다 살짝 넓은 화각이 나온다고 보시면 되겠다.
다시 말해서 (화각이 60도 정도라면) 일정한 거리에서 그냥 광각인 상태에서 찍었을 때 인물을 촬영하기에 자연스러운 화각이 나온다는 뜻이다. 한편, 최대 망원일 때의 화각에 대해서도 감이 잘 오지 않을 수 있는데, 보통 손을 쭉 뻗어 엄지손가락을 치켜 올렸을 때 엄지손가락의 넓이가 대략 1도 수평 정도의 화각이라 할 수 있다. 따라서 수평 화각이 3.5도라고 하면 손을 뻗었을 때 대략 손가락 3~4개 정도의 넓이라고 보시면 되겠다.

※ 3도 시야 = 대략 손가락 3개 넓이 (손을 쭉 뻗었을 때)
아래의 표는 Full Frame 센서의 초점거리에 따른 화각을 보여 주고 있다. 위에서 예를 든 PTZ 카메라의 경우 최대 광각에서 60도, 최대 망원에서 3.5도의 화각을 보여 주므로 Full Frame 센서 카메라에 약 32mm ~ 600mm 줌 렌즈를 달아 놓은 것과 유사한 화각임을 알 수 있다.

※ 표 출처: shotkit.com
영상 인터페이스의 선택
컴퓨터 모니터를 위한 인터페이스는 Analog 15-pin D-sub에서 DVI로, 그리고 다시 DP (DisplayPort)로 진화했다. 방송용 장비의 경우도 이제 BNC 케이블 기반의 SDI (Serial Digital Interface)에서 점차 Optical과 Ethernet (IP)로 업그레이드되고 있다. PTZ 카메라의 경우 SDI, HDMI, USB, Ethernet (IP) 등 4가지 인터페이스를 통해 영상을 출력해 준다.
아직까지는 주변기기나 장비와의 호환성 문제로 SDI와 HDMI가 대부분을 차지하고 있지만, 개인방송이나 화상회의 등 직접 송출을 하는 경우 USB를 많이 활용하기도 한다. 또한 설치비용의 절감과 유연한 시스템을 구현하기 위해 Ethernet 기반으로 전체 시스템을 구축하는 방식이 최근 크게 증가하고 있다.

예산 측면에서 봤을 때 일반적으로 HDMI만을 지원하는 방송장비에 비해 SDI를 전용으로 지원하거나 HDMI와 SDI를 모두 지원하는 방송장비들이 좀 더 비싼 편이다. 시스템 구축의 용이성 면에서는 SDI가 HDMI에 비해 훨씬 멀리 전송이 가능하고 커넥터에 끼운 후 잠금 (Lock)을 할 수 있기 때문에 연결 유지면에서도 안전하다. 3G-SDI 기준으로 최대 150m 정도까지 전송할 수 있는데, 만약 이것보다 더 긴 거리의 장비들과 연결해야 할 경우 SFP나 Ethernet을 사용해야 한다. 각각의 호환되는 장비, 전송거리, 설치의 편리성과 경제성, 유지보수 및 운영의 유연성 등에서 각기 장단점이 있기 때문에 전문가의 도움을 받는 것이 좋겠다.
어떤 코덱을 선택해야 하나?
코덱은 (CODEC) 영상이나 음성 파일을 압축 (Compression)하거나 압축을 푸는 것(Decompression)을 줄인 말이다. 즉, 파일의 크기가 너무 크면 송수신에 너무 많은 대역폭이 필요로 하게 되므로 그 크기를 줄여 작은 대역폭으로 많은 영상을 보내고 받을 수 있도록 하기 위한 것이다.
영상파일의 크기를 줄이는 방법은 여러가지가 있는데 우리가 흔히 사용하는 영상파일들은 대부분 원본 영상의 1/100 내외로 압축을 한다. MPEG-2, MPEG-4, MPEG-5 등의 코덱이 대표적이며, 국제적으로 표준화된 코덱이다. 아래의 표에서 볼 수 있듯이 최신의 코덱일수록 압축률이 대폭 높아지는데, 대신 가벼워진 만큼 더 복잡한 알고리즘을 사용하기 때문에 인코더와 디코더에서 더 많은 프로세싱 파워와 시간이 필요하게 된다.
참고로 아래 표에 있는 AVC/H.264라는 코덱은 정확하게 표기하자면 ITU-T H.264이며, ISO/IEC 14496-10-MPEG-4 Part 10 AVC와 동일한 표준이다. 즉, H.264 = MPEG-4 이라는 것이다. MPEG-2 역시 ISO/IEC의 표준문서 번호이고 ITU 표준으로는 ITU-T H.262이다. 또 한 가지 참고하실 것은 압축코덱의 명칭과 그 압축파일을 담고 있는 컨테이너 (Container)의 명칭이 동일한 경우도 있고 그렇지 않은 경우도 있다는 것이다.
예를 들어, MP4는 압축코덱 MPEG-4에서 나온 약자이기는 하지만 파일 컨테이너의 확장자 (mp4)이다. 이 mp4 컨테이너에는 MPEG-2, MPEG-4, MPEG-5 (MPEG-H HEVC) 등의 압축코덱을 모두 담을 수 있다. 따라서 MPEG-4 압축코덱은 mp4 파일에 담기지만, mp4 파일이라고 해서 압축코덱이 항상 MPEG-4인 것은 아니라는 점을 기억할 필요가 있다.

※ 이미지 출처: TTA
지난 10년간 많은 방송국들이 SDI 기반에서 IP 기반으로 워크플로우를 바꾸고자 노력해 왔다. 하지만, 높은 품질의 화질과 지연 없는 송수신이 요구되었기 때문에 압축코덱과 그 송수신 프로토콜에 대한 표준화 작업이 상당히 오래 걸렸다. 이제는 SMPTE ST-2110으로 표준화가 되었지만 실제 현장에 활용되기에는 여전히 많은 난관이 있는데, 가장 큰 문제는 역시 무압축에 따른 높은 대역폭이라 하겠다. UHD의 2160/60p는 고사하고 FHD의 1080/60p를 구현하고자 해도 3~4개의 영상이 하나의 케이블로 왔다 갔다 하려면 10G 망으로도 부족하기 때문이다. 그렇다고 10G 이상으로 망을 확충하려면 그 비용이 상당하고, 특히 12G-SDI를 대체하여 UHD 방송을 하려는 경우 40G 망을 구축해야 하는 엄청난 투자를 해야 한다.
이에 따라 최근에는 JEPG-XS와 같은 많이 압축된 코덱도 표준에 포함되기는 하였지만, 기존에 1G 망이 깔려 있는 인프라에서 작동하기에는 여전히 파일 사이즈가 너무 크다. 이러한 문제를 해결하고 좀더 가볍게 IP 방송을 할 수 있도록 한 것이 바로 NewTek에서 2015년에 선보인 NDI (Network Device Interface)라는 솔루션이다. NDI는 프로토콜이자 파일 포맷을 뜻하기도 하는데, (오리지널) NDI의 경우 SpeedHQ라는 코덱을 사용하는데 ST-2110이나 JPEG-XS에 비해서는 훨씬 가볍다. delay도 비교적 짧은 편이고, 비트레이트 (bit rate)도 최대 250Mbps이기 때문에 SDI에서 IP로의 전환에 크게 기여하고 있다.
그런데 이 정도도 무겁다며 더 가벼운 코덱을 요구하는 고객들이 생겨났고 결국 NewTek은 NDI-HX를 발표하게 된다. NDI-HX는 (오리지날) NDI (High Bandwidth NDI 혹은 Full NDI)에 비해 파일 사이즈는 훨씬 줄었지만 대신 압축 알고리즘이 복잡해지면서 Latency 가 더 늘어났다. 압축코덱은 최근 가장 많이 사용되고 있는 MPEG-4 (H.264)와 MPEG-5 (H.265 or HEVC)를 사용하기 때문에 파일 컨테이너만 바꿔주면 쉽게 일반 NLE용 코덱으로 변환이 가능하다.
2022년 봄에 발표된 NDI-HX3는 (Full) NDI의 낮은 delay와 NDI-HX의 높은 압축률을 절충한 것이라고 한다. HX3는 HX와 마찬가지로 H.264를 기반으로 하지만 H.264가 I, B, P 프레임으로 구성되어 있는데 비해 HX3는 I와 P 프레임만을 사용한다고 한다. 이 덕분에 HX보다 용량은 늘어나지만 화질은 개선되고 지연시간 (delay)은 줄어드는 장점이 있어, 향후 가장 애용되는 NDI 코덱이 될 가능성도 있어 보인다.


아래의 그래프는 (Full) NDI와 NDI-HX의 대역폭을 비교한 것이다. NDI-HX가 (Full) NDI에 비해 대략 10배 정도 더 가볍다는 것을 알 수 있다. 참고로 NDI는 압축코덱도 NDI이며, 파일포맷도 NDI이고, 전송 프로토콜도 NDI라고 부른다.

따라서 ‘NDI’라고 했을 때 정확히 어떤 것을 뜻하는 지 주의해서 볼 필요가 있으며, NDI의 어떤 버전을 사용할 것인지는 용도와 예산에 따라 달라질 수 밖에 없다. 예를들어 기존에 깔려 있는 1G 네트워크를 그대로 사용해야 하며, 주로 인터넷을 통한 스트리밍 서비스를 해야 하는 경우 약간의 delay는 크게 문제되지 않을 것이다. 이 경우 NDI-HX1, HX2가 지원되는 PTZ 카메라를 사용해야 한다.
반면에 양방향 소통이 필요한 프로그램이나 서비스의 경우 최소한의 delay만 있어야 하기 때문에 NDI (Full) 혹은 NDI-HX3를 선택하는 것이 좋다. 물론 화질면에서도 장점이 있지만 일단 지연 (latency) 가 낮아져 대신 파일은 좀 더 무거워진다. PTZ 카메라의 모델에 따라 지원하는 NDI의 버전이 모두 다르기 때문에 이 점 유의 깊게 살펴 봐야 한다.
이더넷 (Ethernet) 케이블로 전기까지 공급한다고?
SDI가 아닌 IP를 사용하는데 있어 또 다른 장점 중 하나가 배선이 정말 간결해 진다는 점이다. SDI는 꽂기만 하면 바로 영상이 나오기 때문에 너무 쉽고 편리한데, 대신 전송거리도 제한이 있으며 무겁고 비싼 케이블을 설치하거나 연결해 주는 것이 큰 일이다. 반면에 NDI와 같이 Ethernet을 활용하는 솔루션의 경우 그냥 LAN 선 하나만 꽂아 주면 끝이다. 물론 IP 설정이라든지 하는 부분이 조금 어려울 수도 있겠으며, 전원도 따로 넣어 줄 필요가 없다는 점은 설치와 유지보수 입장에서 매우 큰 장점이라 하겠다.
이를 가능하게 해 주는 기술이 바로 PoE (Power over Ethernet)라고 한다. 현재 PoE, PoE+, PoE++ 등 3가지 표준이 사용되고 있는데 일일이 전원 끌어 다가 꽂아주고 배선 감추고 하는 일이 없어 정말 편리하다. PTZ 카메라 등 사용하는 장비의 소비전력과 수량 등에 맞는 적절한 소비전력이나 최대 공급전력을 계산해서 선택하시면 된다. PTZ 카메라만을 고려했을 때 거의 대부분의 제품들이 PoE+를 지원하는 Ethernet Hub를 선택하시면 충분히 운용이 가능하다.

※ 4K PTZ 카메라 K6-20BC
PTZ 카메라란 무엇인가?
PTZ 카메라는 추가적인 기구없이 카메라 자체적으로 Pan (좌우회전), Tilt (상하회전), Zoom (확대) 기능이 가능하도록 제작한 카메라 시스템을 뜻한다. 아래의 좌측과 같은 방송용 카메라의 경우 고도로 훈련된 카메라 크루 (Camera Crew)에 의해 운영되므로 수동으로 Pan, Tilt, Zoom을 하게 된다. 하지만 이런 크고 무거우며 매우 비싼 고화질 카메라와 숙달된 운영자를 사용할 수 없는 경우 PTZ 카메라가 좋은 대안이 될 수 있다. 카메라 전문 운영인력이 없어도 될 정도로 조작이 쉽고, 스튜디오 밖이나 혹은 매우 멀리 떨어진 곳에서도 원격으로 카메라를 조작할 수 있기 때문이다. 따라서 PTZ 카메라는 원격중계, 원격촬영, 원격학습, 원격회의, 원격진료 등 다양한 분야에 사용되고 있다.
※ ENG 카메라(출처: Sony) vs PTZ 카메라 (PTZ4U A7-20NT)
PTZ 카메라 구매가이드
모든 제품들이 그렇지만 PTZ 카메라 역시 구매할 때 다양한 스펙들을 검토해서 용도에 맞는 제품을 선택해야 합니다. 최신의 PTZ 카메라에는 여러가지 낯선 용어들이 등장하는데 주요 스펙에 대해 간략하게 설명해 드리겠다.
이미지 센서가 커지면 벌어지는 현상
일반적으로 카메라의 이미지 센서가 커 지면 더 높은 해상도를 지원할 수 있고, 보통 수광 능력도 좋아져 화질 향상에 유리하다. 그래서 촬영 전문가들이나 카메라 매니아들은 점점 더 큰 이미지 센서를 장착한 카메라로 업그레이드하고 싶어 한다. 하지만 이미지 센서가 커지면 당연히 카메라도 커지고 무거워져 기동성이 떨어지고 조작이 어려워져 부가적인 장비를 필요로 하게 된다. 또한 카메라 뿐 아니라 렌즈나 배터리, 삼각대 등 주변기기도 더 크고 비싼 것들을 써야 하기 때문에 더 많은 예산을 필요로 하게 된다.
PTZ 카메라의 경우 최신의 고해상도 제품의 경우 1” 센서나 4/3" 센서를 사용하기도 하지만, 2025년 현재 기준으로 UHD급에는 1/1.8 ~ 1/2.5인치 센서가 많이 사용되고, HD급에는 1/2.5~2.8인치급 센서가 가장 많이 사용되고 있다. PTZ 카메라에 이렇게 작은 센서를 사용하는 것은 팬/틸트/줌이 가능하면서도 충분히 작고 저렴하게 만들기 수 있기 때문이다.
※ 이미지 출처: Wikipedia
카메라의 이미지 센서가 커질 때 달라지는 이런 기본적이고 상식적인 차이 말고, 우리가 종종 놓치는 포인트가 있는데 바로 초점이 맞는 거리 즉 DoF (Depth of Field)라는 개념이다. DoF를 한 마디로 말하자면 초점 (Focus)이 맺히는 거리가 얼마나 긴 지를 뜻하는 것이다. 인물을 촬영할 때 얼굴은 선명하게 나오지만 그 뒤의 배경이 흐릿하게 나오는 경우를 사진이나 영상에서 종종 봤을 것이다. DoF가 약 30 ~ 50cm 정도인 경우라면 인물 뒤의 배경이 아주 멋있게 흐려지며 멋진 느낌을 주게 될 것이다. 반대로 멀고 가까운 여부와 관계없이 모든 피사체들이 선명하게 촬영되었다면 DoF가 매우 긴 경우라 보면 된다.
DoF에 영향을 미치는 요소는 3가지인데, 첫번째가 이미지 센서의 크기이다. 이미지 센서가 클 수록 초점이 맞는 거리가 짧고, 반대로 이미지 센서가 작아지면 초점이 맞는 거리가 상대적으로 길어진다. 즉, 이미지 센서가 작으면 가까이에 있는 피사체나 멀리 있는 피사체나 다 선명하게 촬영된다. 반면에 이미지 센서가 커 질수록 초점이 맞는 거리(DOF)가 짧아져 초점 (Focus)가 잘 맞도록 수동 혹은 자동으로 초점 조절을 잘 해 주어야 한다. 대신 미적인 영상을 만들 수 있다는 장점이 있다.
※ 이미지 출처: PNGegg
DoF에 영향을 미치는 또 다른 2가지 요소는 바로 조리개(Iris) 값과 줌 (Zoom) 배율이다. 조리개를 최대한 개방할수록, 그리고 줌을 최대한 많이 당길수록 초점이 맺히는 거리가 짧아진다. 즉, DoF가 낮아지게 되는 것이다. 반대로 조리개를 더 작게 조일수록, 그리고 줌을 하지 않을수록 (광각일 수록) 초점이 맺히는 거리가 더 길어지게 된다.
예를 들어, 35mm Full Frame 센서가 장착된 캐논 5D 카메라에서 조리개를 최대 개방했을 때의 값이 f.2.8인 24-70mm 줌 렌즈를 장착했다고 가정해 보자. 풍경을 찍을 때는 최대 광각인 24mm (수평 화각 약 74도)에 조리개는 약 f.8 ~ f.11 정도로 조여 줄 것이다. 반면에 인터뷰 사진을 찍고 싶다면 2m 정도의 거리에서 줌은 약 35~50mm 정도로 놓고, 조리개는 최대인 f.2.8까지 개방하고 싶을 것이다. 이 보다 더 느낌 있는 인물 사진을 찍고 싶다면 아마도 조금 더 뒤로 물러선 후 줌을 70mm로 최대한 당긴 상태에서 조리개도 f.2.8로 최대한 개방해서 인물의 뒷배경을 날리고자 할 것이다.
※ 이미지 출처: PNGegg
이렇게 센서가 클수록, 조리개를 많이 개방할수록, 그리고 줌(zoom)을 많이 당길수록 더 예술적인 느낌의 촬영이 가능해진다. 하지만 큰 영화를 촬영할 때에는 카메라의 초점만을 전문적으로 맞춰 주는 포커스 풀러 (Focus Puller)를 따로 고용해야 할 정도로 정확히 초점을 맞추는 것이 어렵다. 영화 촬영에 사용하는 큰 카메라들은 센서도 크고, 전문 렌즈를 사용하여 조리개 개방도 많이 할 수 있기 때문에 인물을 촬영할 때에는 DoF가 매우 짧은 경우가 대부분이기 때문이다. 반대로 이미지 센서가 충분히 작다면 초점을 맞추기 위해 수동조작을 할 필요가 별로 없고, Auto Focus 기능이 있을 경우에도 훨씬 빠르고 정확하게 초점을 잘 잡아 준다.
줌 (Zoom) 배율과 함께 꼭 살펴봐야 할 스펙은?
PTZ 카메라를 선택할 때 보통 해상도와 함께 몇 배 줌 (zoom)을 지원하는 지를 가장 먼저 확인하는게 일반적이다. 팬(Pan)과 틸트(Tilt) 성능도 중요하지만 줌(zoom) 성능이 PTZ 카메라의 활용 범위에 중요한 영향을 미치지 때문이다. 물론 줌 배율이 높을수록 더 비싼 줌 모듈을 채용해야 하기 때문에 당연히 원가도 상승하게 된다.
그런데 PTZ 카메라의 스펙에서 줌 배율만큼 중요한 것이 또 있는데 바로 화각 (Field of View)이다. 같은 20배 줌이라고 하더라도 최대 광각(Wide)일 때의 화각과 최대 망원(Tele)일 때의 화각이 다른 경우가 많다. 중요한 것은 내가 사용하고자 하는 공간의 크기와 피사체들이 배치된 상태를 고려해서 화각을 선택해야 한다는 것이다. 예를 들어, 강의실의 뒷벽에 설치해서 강의실의 전체적인 모습을 모니터링하려고 할 때, 만약 강의실이 가로로 넓거나 부채꼴 모양이라면 70도 이상의 넓은 수평 화각을 가진 PTZ 카메라를 선택해야 한다. 반면에 강사를 전담해서 촬영할 PTZ 카메라의 경우 50 ~ 60도 정도의 화각을 가진 경우가 오히려 낫다. 줌을 많이 하지 않더라도 강사를 적절한 구도와 초점으로 촬영할 수 있기 때문이다.
앞서 설명한 바와 같이 Zoom을 많이 하면 작은 센서의 카메라라 하더라도 배경을 흐려주는 효과가 나타날 수 있다. 따라서 강사를 촬영하는 카메라가 zoom in을 많이 하게 되면 강사 뒤에 있는 칠판이 잘 안 보일 수 있다. 따라서 (칠판을 같이 보여 주어야 하는 경우) 강사 전담 카메라는 너무 멀리 배치해서 zoom을 당기기 보다는 상대적으로 가까이에 놓고 zoom을 최소화하는 것이 유리하다.
예를 들어, 아래와 같은 4K/UHD 해상도의 PTZ 카메라 스펙을 비교해 보자. A7-12NT는 1/2.5인치 센서를 채용하였고, 광학 12배 줌이며, 수평 화각은 약 81도~7.5도이다. 이에 비해 A7-20NT와 A7-20NT-12G는 1/1.8인치 센서를 채용하였고, 광학 20배 줌에 수평 화각은 약 60 ~ 3.5도이다. A7-12NT의 렌즈 스펙을 보면 초점거리는 f=3.47 ~ 41.65mm라고 표기되어 있는데, 이는 zoom을 하지 않는 최대 광각일 때 초점거리가 3.47mm이고 최대 망원일 때가 41.65mm라는 뜻이다.
참고로, 이 초점거리는 센서 사이즈에 따라 실제 보여지는 화각이 다르기 때문에 (일반 카메라의 경우) 보통 35mm Full Frame 센서의 초점거리로 환산한 값을 같이 표기해 준다. 일반적으로 PTZ 카메라의 경우 이 초점거리의 변화로 인한 구도의 차이를 보다 직관적으로 알 수 있도록 화각 (Field of View)을 같이 표기해 주고 있다.
이렇게 수평 화각으로 표기해 주어도 감이 잘 안 오는 분들이 많을 텐데, 보통 인물 촬영을 할 때 (Full Frame 센서 기준으로) 35mm나 50mm 단렌즈를 많이 사용한다. 이 때의 수평 화각이 각각 대략 54.4도와 39.6도이다. 따라서 이 PTZ 카메라의 최대 광각인 60도는 (Full Frame 센서의 카메라에서) 35mm 렌즈를 장착했을 때보다 살짝 넓은 화각이 나온다고 보시면 되겠다.
다시 말해서 (화각이 60도 정도라면) 일정한 거리에서 그냥 광각인 상태에서 찍었을 때 인물을 촬영하기에 자연스러운 화각이 나온다는 뜻이다. 한편, 최대 망원일 때의 화각에 대해서도 감이 잘 오지 않을 수 있는데, 보통 손을 쭉 뻗어 엄지손가락을 치켜 올렸을 때 엄지손가락의 넓이가 대략 1도 수평 정도의 화각이라 할 수 있다. 따라서 수평 화각이 3.5도라고 하면 손을 뻗었을 때 대략 손가락 3~4개 정도의 넓이라고 보시면 되겠다.
※ 3도 시야 = 대략 손가락 3개 넓이 (손을 쭉 뻗었을 때)
아래의 표는 Full Frame 센서의 초점거리에 따른 화각을 보여 주고 있다. 위에서 예를 든 PTZ 카메라의 경우 최대 광각에서 60도, 최대 망원에서 3.5도의 화각을 보여 주므로 Full Frame 센서 카메라에 약 32mm ~ 600mm 줌 렌즈를 달아 놓은 것과 유사한 화각임을 알 수 있다.
※ 표 출처: shotkit.com
영상 인터페이스의 선택
컴퓨터 모니터를 위한 인터페이스는 Analog 15-pin D-sub에서 DVI로, 그리고 다시 DP (DisplayPort)로 진화했다. 방송용 장비의 경우도 이제 BNC 케이블 기반의 SDI (Serial Digital Interface)에서 점차 Optical과 Ethernet (IP)로 업그레이드되고 있다. PTZ 카메라의 경우 SDI, HDMI, USB, Ethernet (IP) 등 4가지 인터페이스를 통해 영상을 출력해 준다.
아직까지는 주변기기나 장비와의 호환성 문제로 SDI와 HDMI가 대부분을 차지하고 있지만, 개인방송이나 화상회의 등 직접 송출을 하는 경우 USB를 많이 활용하기도 한다. 또한 설치비용의 절감과 유연한 시스템을 구현하기 위해 Ethernet 기반으로 전체 시스템을 구축하는 방식이 최근 크게 증가하고 있다.
예산 측면에서 봤을 때 일반적으로 HDMI만을 지원하는 방송장비에 비해 SDI를 전용으로 지원하거나 HDMI와 SDI를 모두 지원하는 방송장비들이 좀 더 비싼 편이다. 시스템 구축의 용이성 면에서는 SDI가 HDMI에 비해 훨씬 멀리 전송이 가능하고 커넥터에 끼운 후 잠금 (Lock)을 할 수 있기 때문에 연결 유지면에서도 안전하다. 3G-SDI 기준으로 최대 150m 정도까지 전송할 수 있는데, 만약 이것보다 더 긴 거리의 장비들과 연결해야 할 경우 SFP나 Ethernet을 사용해야 한다. 각각의 호환되는 장비, 전송거리, 설치의 편리성과 경제성, 유지보수 및 운영의 유연성 등에서 각기 장단점이 있기 때문에 전문가의 도움을 받는 것이 좋겠다.
어떤 코덱을 선택해야 하나?
코덱은 (CODEC) 영상이나 음성 파일을 압축 (Compression)하거나 압축을 푸는 것(Decompression)을 줄인 말이다. 즉, 파일의 크기가 너무 크면 송수신에 너무 많은 대역폭이 필요로 하게 되므로 그 크기를 줄여 작은 대역폭으로 많은 영상을 보내고 받을 수 있도록 하기 위한 것이다.
영상파일의 크기를 줄이는 방법은 여러가지가 있는데 우리가 흔히 사용하는 영상파일들은 대부분 원본 영상의 1/100 내외로 압축을 한다. MPEG-2, MPEG-4, MPEG-5 등의 코덱이 대표적이며, 국제적으로 표준화된 코덱이다. 아래의 표에서 볼 수 있듯이 최신의 코덱일수록 압축률이 대폭 높아지는데, 대신 가벼워진 만큼 더 복잡한 알고리즘을 사용하기 때문에 인코더와 디코더에서 더 많은 프로세싱 파워와 시간이 필요하게 된다.
참고로 아래 표에 있는 AVC/H.264라는 코덱은 정확하게 표기하자면 ITU-T H.264이며, ISO/IEC 14496-10-MPEG-4 Part 10 AVC와 동일한 표준이다. 즉, H.264 = MPEG-4 이라는 것이다. MPEG-2 역시 ISO/IEC의 표준문서 번호이고 ITU 표준으로는 ITU-T H.262이다. 또 한 가지 참고하실 것은 압축코덱의 명칭과 그 압축파일을 담고 있는 컨테이너 (Container)의 명칭이 동일한 경우도 있고 그렇지 않은 경우도 있다는 것이다.
예를 들어, MP4는 압축코덱 MPEG-4에서 나온 약자이기는 하지만 파일 컨테이너의 확장자 (mp4)이다. 이 mp4 컨테이너에는 MPEG-2, MPEG-4, MPEG-5 (MPEG-H HEVC) 등의 압축코덱을 모두 담을 수 있다. 따라서 MPEG-4 압축코덱은 mp4 파일에 담기지만, mp4 파일이라고 해서 압축코덱이 항상 MPEG-4인 것은 아니라는 점을 기억할 필요가 있다.
※ 이미지 출처: TTA
지난 10년간 많은 방송국들이 SDI 기반에서 IP 기반으로 워크플로우를 바꾸고자 노력해 왔다. 하지만, 높은 품질의 화질과 지연 없는 송수신이 요구되었기 때문에 압축코덱과 그 송수신 프로토콜에 대한 표준화 작업이 상당히 오래 걸렸다. 이제는 SMPTE ST-2110으로 표준화가 되었지만 실제 현장에 활용되기에는 여전히 많은 난관이 있는데, 가장 큰 문제는 역시 무압축에 따른 높은 대역폭이라 하겠다. UHD의 2160/60p는 고사하고 FHD의 1080/60p를 구현하고자 해도 3~4개의 영상이 하나의 케이블로 왔다 갔다 하려면 10G 망으로도 부족하기 때문이다. 그렇다고 10G 이상으로 망을 확충하려면 그 비용이 상당하고, 특히 12G-SDI를 대체하여 UHD 방송을 하려는 경우 40G 망을 구축해야 하는 엄청난 투자를 해야 한다.
이에 따라 최근에는 JEPG-XS와 같은 많이 압축된 코덱도 표준에 포함되기는 하였지만, 기존에 1G 망이 깔려 있는 인프라에서 작동하기에는 여전히 파일 사이즈가 너무 크다. 이러한 문제를 해결하고 좀더 가볍게 IP 방송을 할 수 있도록 한 것이 바로 NewTek에서 2015년에 선보인 NDI (Network Device Interface)라는 솔루션이다. NDI는 프로토콜이자 파일 포맷을 뜻하기도 하는데, (오리지널) NDI의 경우 SpeedHQ라는 코덱을 사용하는데 ST-2110이나 JPEG-XS에 비해서는 훨씬 가볍다. delay도 비교적 짧은 편이고, 비트레이트 (bit rate)도 최대 250Mbps이기 때문에 SDI에서 IP로의 전환에 크게 기여하고 있다.
그런데 이 정도도 무겁다며 더 가벼운 코덱을 요구하는 고객들이 생겨났고 결국 NewTek은 NDI-HX를 발표하게 된다. NDI-HX는 (오리지날) NDI (High Bandwidth NDI 혹은 Full NDI)에 비해 파일 사이즈는 훨씬 줄었지만 대신 압축 알고리즘이 복잡해지면서 Latency 가 더 늘어났다. 압축코덱은 최근 가장 많이 사용되고 있는 MPEG-4 (H.264)와 MPEG-5 (H.265 or HEVC)를 사용하기 때문에 파일 컨테이너만 바꿔주면 쉽게 일반 NLE용 코덱으로 변환이 가능하다.
2022년 봄에 발표된 NDI-HX3는 (Full) NDI의 낮은 delay와 NDI-HX의 높은 압축률을 절충한 것이라고 한다. HX3는 HX와 마찬가지로 H.264를 기반으로 하지만 H.264가 I, B, P 프레임으로 구성되어 있는데 비해 HX3는 I와 P 프레임만을 사용한다고 한다. 이 덕분에 HX보다 용량은 늘어나지만 화질은 개선되고 지연시간 (delay)은 줄어드는 장점이 있어, 향후 가장 애용되는 NDI 코덱이 될 가능성도 있어 보인다.
아래의 그래프는 (Full) NDI와 NDI-HX의 대역폭을 비교한 것이다. NDI-HX가 (Full) NDI에 비해 대략 10배 정도 더 가볍다는 것을 알 수 있다. 참고로 NDI는 압축코덱도 NDI이며, 파일포맷도 NDI이고, 전송 프로토콜도 NDI라고 부른다.
따라서 ‘NDI’라고 했을 때 정확히 어떤 것을 뜻하는 지 주의해서 볼 필요가 있으며, NDI의 어떤 버전을 사용할 것인지는 용도와 예산에 따라 달라질 수 밖에 없다. 예를들어 기존에 깔려 있는 1G 네트워크를 그대로 사용해야 하며, 주로 인터넷을 통한 스트리밍 서비스를 해야 하는 경우 약간의 delay는 크게 문제되지 않을 것이다. 이 경우 NDI-HX1, HX2가 지원되는 PTZ 카메라를 사용해야 한다.
반면에 양방향 소통이 필요한 프로그램이나 서비스의 경우 최소한의 delay만 있어야 하기 때문에 NDI (Full) 혹은 NDI-HX3를 선택하는 것이 좋다. 물론 화질면에서도 장점이 있지만 일단 지연 (latency) 가 낮아져 대신 파일은 좀 더 무거워진다. PTZ 카메라의 모델에 따라 지원하는 NDI의 버전이 모두 다르기 때문에 이 점 유의 깊게 살펴 봐야 한다.
이더넷 (Ethernet) 케이블로 전기까지 공급한다고?
SDI가 아닌 IP를 사용하는데 있어 또 다른 장점 중 하나가 배선이 정말 간결해 진다는 점이다. SDI는 꽂기만 하면 바로 영상이 나오기 때문에 너무 쉽고 편리한데, 대신 전송거리도 제한이 있으며 무겁고 비싼 케이블을 설치하거나 연결해 주는 것이 큰 일이다. 반면에 NDI와 같이 Ethernet을 활용하는 솔루션의 경우 그냥 LAN 선 하나만 꽂아 주면 끝이다. 물론 IP 설정이라든지 하는 부분이 조금 어려울 수도 있겠으며, 전원도 따로 넣어 줄 필요가 없다는 점은 설치와 유지보수 입장에서 매우 큰 장점이라 하겠다.
이를 가능하게 해 주는 기술이 바로 PoE (Power over Ethernet)라고 한다. 현재 PoE, PoE+, PoE++ 등 3가지 표준이 사용되고 있는데 일일이 전원 끌어 다가 꽂아주고 배선 감추고 하는 일이 없어 정말 편리하다. PTZ 카메라 등 사용하는 장비의 소비전력과 수량 등에 맞는 적절한 소비전력이나 최대 공급전력을 계산해서 선택하시면 된다. PTZ 카메라만을 고려했을 때 거의 대부분의 제품들이 PoE+를 지원하는 Ethernet Hub를 선택하시면 충분히 운용이 가능하다.