엑셀에서 복사해 온 데이터에 공백이 덕지덕지 붙어 있다. 영문은 대문자 소문자가 섞여 있고, 줄바꿈도 뒤죽박죽이다. 하나씩 고치려면 시간이 끝도 없다.
어떤 작업을 할 수 있나
| 카테고리 | 기능 | 활용 예시 |
|---|---|---|
| 대소문자 변환 | 전체 대문자, 전체 소문자, 문장형, 제목형 등 7가지 | 이메일 주소 소문자 통일, 제목 스타일 정리 |
| 텍스트 조작 | 공백 제거, 줄바꿈 정리, 중복 제거, 정렬 | 엑셀 데이터 정리, 리스트 중복 제거 |
| 인코딩 | URL, Base64, HTML 특수문자, 유니코드 변환 | API 파라미터 인코딩, HTML 이스케이프 |
자주 쓰는 변환 3가지
1. 영문 대소문자 통일
여러 사람이 입력한 데이터는 대소문자가 제각각이다. "Seoul", "SEOUL", "seoul"이 섞여 있으면 검색이나 정렬에서 문제가 생긴다. 온라인 텍스트 변환기에 붙여넣고 lowercase 버튼 한 번이면 전부 소문자로 바뀐다.
2. 불필요한 공백과 줄바꿈 제거
웹페이지에서 복사한 텍스트에는 보이지 않는 공백이 숨어 있는 경우가 많다. 단어 사이에 공백이 두세 개씩 들어가거나, 빈 줄이 중간중간 끼어 있다. 공백 정리 기능을 쓰면 여러 공백을 하나로 합치고, 빈 줄도 한 번에 제거된다.
3. URL 인코딩
API 요청에 한글 파라미터를 넣으면 깨지는 경우가 있다. "서울특별시"를 URL 인코딩하면 %EC%84%9C%EC%9A%B8%ED%8A%B9%EB%B3%84%EC%8B%9C가 된다. 디코딩은 그 반대다. 개발할 때 수시로 필요한 기능이다.
TIP 중복 줄 제거 기능은 이메일 리스트나 태그 목록 정리할 때 유용하다. 수백 줄짜리 리스트에서 중복을 하나하나 찾는 것보다 한 번에 걸러내는 게 훨씬 빠르다.
개발자가 쓰는 변환
변수명 스타일을 바꿔야 할 때도 텍스트 변환기가 쓰인다. 언어마다 네이밍 컨벤션이 다르기 때문이다.
- camelCase: JavaScript, Java에서 주로 사용
- snake_case: Python, Ruby에서 주로 사용
- Title Case: 문서 제목이나 헤딩에 적용
- UPPERCASE: 상수명, 환경 변수
텍스트 정리는 단순 반복 작업이다. 손으로 하면 실수도 나고 시간도 걸린다. 붙여넣기하고 버튼 하나 누르는 게 가장 확실하다.