끝나지 않는 프로그래밍 일기


1. 정규 표현식(Regular Expression, Regex)란 무엇인가?


오랜만에 강좌를 시작해보는듯 합니다. 시험기간에 밀려 블로그에 포스팅을 하지 못했는데, 이제야 글을 쓰게 되네요. 잡담은 여기서 멈추고, 본론으로 들어가도록 하겠습니다.


혹시 정규 표현식(Regular Expression, Regex)라고 들어보신적이 있으신가요? 이 정규 표현식은 텍스트를 검색하거나, 혹은 치환하거나 어떠한 문자열을 추출하고자 할때 주로 쓰이는 녀석입니다. 간단히 말하자면, 메타 문자(특수한 문자/기호)를 이용하여 이루어진 패턴을 말합니다.


정규 표현식을 사용하면, 패턴(pattern)을 통해 세밀하게 문자열을 찾아낼 수 있습니다. 아래와 같이 말이죠.


패턴(Pattern):

https?://[\w./]+

텍스트(Text):

http://www.abc.com/

https://www.abc.net/

ftp://www.abc.org/

irc://www.abc.org/

결과(Result):

0 : http://www.abc.com/

21 : https://www.abc.net/


패턴을 통해서 텍스트 내에 우리가 원하는 문자열만을 정확히 뽑아낼 수가 있습니다. VB.NET에 포함된 정규 표현식을 기준으로 강좌를 진행해 나가도록 할 것이며, 언어마다 조금조금씩 다를 수 있습니다. (언어마다 조금씩 다르나, 약간의 차이가 존재할 수 있습니다.)

RegExTester_VB_NET.zip


정규 표현식에 대한 소개는 여기서 마치도록 하고, 다음 강좌 부터에서는 간단한 정규 표현식을 알아보도록 하겠습니다. 감사합니다.