OpenClaw 에이전트를 실제 브라우저 작업에 연결해 처음 제대로 검증해본 사례가 있었다. 테스트 페이지 수준이 아니라, 실제로 수행해야 하는 작업에 에이전트를 붙여본 것이다. 이번 대상은 민방위 인터넷 교육 이수였다.
이 작업은 단순 클릭 자동화가 아니라, 브라우저 세션 상태 유지, 화면 전환, 진행 상황 확인이 모두 필요한 흐름이었다. 즉, 에이전트가 "작동한다"는 것과 "실제 작업에 쓸 수 있다"는 것은 다르다는 걸 확인하기에 적절한 사례였다.
WSL2 환경과 브라우저 연결 문제
작업 환경은 WSL2였다. 문제는 WSL2가 윈도우 호스트와 분리된 실행 환경이라는 점이다. 이 때문에 에이전트가 로컬 브라우저 인스턴스에 바로 연결되기 어렵고, 별도의 브리지 구성이 필요했다. WSL내부에서도 동일하게 크롬을 깔고 실행할 수 있지만 굳이 추가로 설치하고싶지도 않았다.
여기서 사용한 방식은 PowerShell 기반 포트포워딩과 CDP(Chrome DevTools Protocol) 연결이다. 즉, 윈도우에서 실행 중인 브라우저 디버그 포트를 WSL2 쪽에서 접근 가능하도록 열어두고, 에이전트가 그 세션에 붙도록 만든 것이다.
headful 브라우저 기반 검증
민방위 인터넷 교육은 완전 비가시성 자동화로 끝낼 수 있는 작업이 아니었다. 직접 콘텐츠를 확인해야 하고, 진행 상태도 사람이 봐야 했기 때문에 headless 로는 진행하지 않았다.
headful 모드의 장점은 명확하다. 에이전트가 어떤 URL에 있는지, 어떤 요소를 조작하는지, 다음 단계로 정상적으로 전환됐는지를 화면에서 바로 확인할 수 있다. 이번 작업에서는 이 가시성이 매우 중요했다.
실제로는 브라우저를 띄워둔 상태에서 에이전트의 동작을 지켜보는 방식으로 진행했다. 백그라운드에서 무작정 돌리는 형태가 아니라, 중간중간 UI 상태와 흐름을 확인하면서 수행했다. + 교육을 듣기는 해야하니까.
성능과 반응성
체감상 가장 아쉬웠던 부분은 반응 속도였다. 윈도우-WSL2 환경 특성상 응답이 다소 느렸고, 아직 브라우저 자동화 작업에 대해 최적화가 충분히 이루어지지 않아 불필요한 대기 시간이 꽤 발생했다.
이건 단순 성능 문제라기보다 작업 파이프라인의 마찰에 가까웠다. 에이전트가 명령을 받아도 즉시 다음 단계로 이어지지 않는 구간들이 있었고, 그만큼 전체 체감 속도가 떨어졌다.
다만 이 과정 덕분에 병목이 어디서 생기는지는 명확히 보였다. 브라우저 연결 자체보다는 환경 지연, 세션 전환, 동기화 타이밍이 중요한 포인트였다.
확인한 점
- WSL2 환경에서는 브라우저 자동화 연결을 별도로 설계해야 한다
- PowerShell 포트포워딩 + CDP 연결이 실사용에 유효하다
- headful 모드에서 상태 확인이 필요한 작업은 에이전트 검증에 적합하다
결론적으로, 에이전트는 실제 브라우저 기반 업무에 붙일 수 있는 가능성을 보여줬다. 다만 완성도는 환경 최적화와 연결 구조 정리에 크게 좌우된다.
다음 계획
현재 진행 중인 제주도 여행 계획 짜기에도 같은 흐름을 적용해볼 생각이다. 여행 계획은 여러 웹 페이지를 오가며 정보를 수집하고 비교해야 해서, 브라우저 기반 에이전트의 활용도를 확인하기 좋은 작업이다.
이번 민방위 교육이 "연결과 검증"의 첫 실전이었다면, 제주도 여행 계획은 "실사용성"을 보는 다음 단계가 될 것이다.
'Study > AI' 카테고리의 다른 글
| 한국어 TTS 비교 후기: EdgeTTS를 거쳐 Supertonic-2로 정착하기까지 (0) | 2026.04.16 |
|---|---|
| OpenClaw 에서 Hermes 로 옮겨오기까지 (1) | 2026.04.14 |
