engineering/System Eng.2007. 2. 26. 10:47

=============================================
        배열과 포인터는 전혀 다르다 # 1


                 - 프롤로그 -

                13 Dec, 2002
             Written by Un-Wook
=============================================



- 차례 -

1. 서문
2. 주제
3. 문제의 제기 1
4. 문제의 제기 2
6. 윈도우 이야기
7. DOS vs WINDOW
8. 마치며


-----------------------------
1. 서문
-----------------------------

안녕하세요.
그동안 제가 이 게시판에서 글을 여러편 올렸었는데
강좌로서는 이번이 3번째 강좌가 되었네요..
되도록 부담없고 읽기 쉽게 자세히 풀어서 쓰는 것을 목표로 여기까지 달려왔는데..
읽는 분의 입장에서는 어떨지 모르겠어요..
지금까지.. 많지는 않지만 격려해 주신분들에게 너무 감사드리고..
이번에도 최선을 다해서 작성해보겠습니다.
언제나 그랫듯이 제딴에는 최대한 읽기 편하게 쓸 것이구요..  ㅋㅋㅋ
분량도 언제나 그랫듯이 좀 나갈꺼구요..
분량이 많아도.. 말은 다 쉬운말입니다.. 쉽게 쓰려면 분량 많아지는거는 어쩔수가 없는거 가타여..
내용상 문제가 있다면 지적해 주십시오. 오타 같은 것도 찾아 주시면 수정합니다.
지난번 강좌는 비트에 대한 강좌였고, 이번 강좌는 거기서 영역을 조금 넓힌 메모리에 대한 강좌입니다.
읽으시는 분이 최소한 포인터의 의미와 용도를 이해하고 있다 가정하고..
그럼 시작하겠습니다.




-------------------------------------
2. 주제
-------------------------------------

배열과 포인터가 같다고 생각하시나요?..

전혀 다릅니다..

그리고 강좌의 제목은 배열이 어쩌고 포인터가 어쩌고 지만..

제가 써보고 싶은 내용은 메모리의 기본 개념을 잡아보는 것입니다.

본론으로 들어가기 전에 이것저것 기반지식을 먼저 간략하게 설명해 드려리구 합니다.

프로세스에 대해서 좀 설명을 하고..

스택과 힙의 의미를 설명해 나가다가

궁극적으로 배열과 포인터의 차이점을 비교하여 설명할 계획입니다.

아마 주로 스택에 대해서 다루게 될것 같습니다..

되도록이면 저번에 연재 해드렸던 비트강좌를 먼저 이해하고 난 뒤에 읽어주셨으면 좋겠네요..

그 강좌에서 설명했던 용어들을 여기서 다시 설명하진 않으려구요..^^




-------------------------------------
3. 문제의 제기 1
-------------------------------------

아래의 코드를 봐 주세요

   char    *pTest= "01ABC";
   char    cTest[]= "01ABC";

이 두 라인의 차이점이 무엇이라고 생각되세요?

문자열을 다룰때 저렇게 하는 것이라고 생각하신다면.. 제 글을 꼭 끝까지 읽어보세요..

pTest[2] 도 'A' 이고 cTest[2] 도 'A' 입니다..

strlen() 을 이용하여 검사해보면 똑같은 5 라는 값이 넘어옵니다.

pTest 란 것과 cTest 라는 이 두변수가 똑같은 사이즈로 할당되어 있는 것 일까요?

그렇다면 이것이 실제로 같은 동작을 하는 것일까요?




아래와 같은 코드는 프로그램시 왜 서로 결과가 다를까요.. 하나는 에러가 나고.. 하나는 에러가 안납니다.

   strcpy(pTest, "안녕");   // 에러 남
   strcpy(cTest, "안녕");   // 에러 안남




이 차이점을 지금 이해하지 않으신다면..

앞으로 많은 난관을 부딪치게 되실태고... 그러한 과정에서 이해하셔야 할 것입니다.

지금 조급하게 결론을 내려보자면..

배열변수의 데이터는 스택이라는 메모리영역에 잡히기 때문입니다.




-------------------------------------
4. 문제의 제기 2
-------------------------------------

아래 코드는 pTest 와 cTest 변수에, 담긴 값과 그 변수들이 메모리에 어느위치에 확보되어 있는가 얻어오는 코드입니다.

   char    *pTest= "01ABC";
   char    cTest[]= "01ABC";

   printf("pTest : %08x %08x \n", pTest, &pTest);
   printf("cTest : %08x %08x \n", cTest, &cTest);

결과는 다음과 같이 출력됩니다.

   pTest : 0040705c 0012ff78
   cTest : 0012ff7c 0012ff7c

모두가 한번쯤 생각해 봤을만한 코드라고 생각되는데요..


..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:

+*보충설명*+

안 읽으셔두 됨..

& 연산자는 비트연산에서는 and 를 의미하지만

일반 변수 앞에다가 붙혀주면 그 변수가 런타임시 위치하게되는 메모리 주소를 수치로 반환해 줍니다.

어드래스 오퍼레이터라고 부릅니다. 모두 아시는 내용이지만, 노파심에 설명해 보았습니다.

(키워드 & 는 3가지의 의미가 있습니다. Address of operator / Bit operator / Refference operator)

..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:..:+:


cTest 의 경우 조금 특이하지 않나요?..

cTest 의 메모리의 위치와.. cTest 에 담겨있는 값이랑 서로 동일하다는게 말이죠..

앞으로.. 이런 것들을 풀어보려고 합니다.




-------------------------------------
5. 윈도우 이야기
-------------------------------------

포인터와 관련된 메모리 강좌에서 소단원 주제가 "윈도우 이야기" 이라서 좀 의야해 하실것 같습니다만..

다 연관이 되어있고, 미리 설명해야 나중의 설명이 편하기 때문에 꺼내보는 이야기 입니당..




우리가 요즘 사용하는 OS는 대부분이 윈도우즈 95, 98, ME, 2000, NT 일 것입니다..

겜방에 가보나, 시골 친척집에 놀러가보거나.. 요즘 개인용 컴퓨터 봐보면 하나같이 IBM 계열 컴터에다가

"윈도우" 라는 OS 가 설치되어 있습니다.

이 윈도우라는 OS를 WIN32 Platform 이라고 합니다..

플랫폼은 그런의미 입니다.

어떤 장치에서 무엇인가를 구현할수 있게 해주기 위해

기반을 제공해주는 시스템을 플랫폼이라고 해요..

WIN32 플랫폼은 32비트 방식으로 메모리를 다루며, 멀티태스킹이란 것도 지원해주지요..




과거 MS-DOS 플랫폼에선 컴터의 기본메모리를 응용프로그램이 직접 관리해야 했습니다.

곧.. 프로그래머가 물리적인 메모리를 직접 관리한다는 의미 입니다.

실제 메모리의 제한이 걸리는 것도 염두해두어야 했고, 메모리라는 것 때문에 영 골치아플때가 많았지요..

( 확장메모리 서비스를 이용하여 보다 많은 메모리를 사용할 수 있긴 했지만 것두 그냥그냥 쉽지는 않습니다.. )




MS-DOS 는 16 비트 플랫폼 입니다. 16 비트 레지스터를 가지고 메모리 주소를 포인팅하기 때문에

한번에 최대 65535 Byte 이상의 메모리를 포인팅 할수가 없습니다.

한번에 표현가능한수치가 65535 이라 640KB 의 기본메모리를 선형으로 접근할수가 없었다는 말입니당..

생각해 보세요.. 65535 밖에 표현이 안되는데.. 655360 나 되는 물리적 메모리 주소를 담을수가 없잖아요... ㅋㅋㅋ

지금 시대의 분들이 본다면 참 기이한 방식이라고 생각할 수도 있지만

그당시에는 이 문제를 해결하기 위하여 "세그먼트:오프셋" 이라는 방식으로 65535의 한계를 뛰어넘어

640kb 의 메모리를 접근하였습니다.

메모리 구간을 세그먼트로 나누고.. 여기서의 오프셋은.. 세그먼트를 기준으로 상대적인 메로리 주소값을 나타냅니당..

(Watcom C++ 와 같은 32 비트 컴파일러도 있긴 했습니다.)

하지만 지금 생각하시는대루 "세그먼트:오프셋" 방식은 무지 불편했지요..

일딴 연속해서 65535 바이트 이상은 할당 못하는 꼴이니까요..

도스때 프로그래밍을 시작하려 했었던 입문자 입장에서는 이해도 잘 안되고 이해하고싶지도 않지요..




이제 시대는 흘러흘러 WIN32 가 발표 되었습니다.

현재 대부분의 개인용 컴퓨터의 OS가 미국의 코쟁이들이 만들어 놓은 "윈도우" 라는 것이고

어플리케이션을 제작해야만 하는 우리들은..

당연히 OS시장에서 주도권을 잡고있는 WIN32 플랫폼용으로 저작물을 출시하려고 합니다.

우리는 알게모르게 WIN32 의 덕을 좀 많이 보고 있어요

화려한 그래픽 인터페이스 환경에서 비주얼틱하게 프로그래밍을 하며..

더이상 세그먼트:오프셋 이란 것으로 골머리 썩을 필요도 없어지게 되었습니다.

32 비트 로는 40 억까지 수치가 표현 가능합니다..
(이것을 이해 못하시면.. 제가 지난번에 올렸던 비트 강좌를 참조 해 보시구요..)

40 억은.. 약 4 GB 입니다.

WIN32 라는 플랫폼은 32비트로 메모리를 포인팅하기 때문에..

논리적으로 4GB 까지 메모리를 억세스 할수 있다는 이야기에요..

참으로 황당할정도로 방대하지 않을수가 없는 수치입니당..




-------------------------------------
6. DOS vs WINDOW
-------------------------------------

제가 세월의 저편으로 사라진 MS-DOS 이야기를 많이 꺼냈는데.. 그 이유는

윈도우에서 비주얼씨로 프로그래밍하는 것이.. 프로그래밍의 모든 면이 아니라는 것을 말씀 드리고 싶었고..

요즘에는 윈도우부터 프로그래밍을 시작하신 분들이 많아서 그런지..

비주얼틱한 면으로 익숙해지신 분들이 많은 것 같기 때문입니다.




툴이라는 것에만 익숙해지게 되면... 언제나 종속적이되고.. 표현범위 또한 한정적일 수 밖에 없습니다.

프로그래밍은 기초와 기본원리가 중요하다고 생각합니다.

제가 잠깐 재직했던 회사의 상사님께서도 언제나 강조하셨던 말씀이구요.

지금까지의 제 강좌가 최신 기술쪽 보다는 기초와 원리 위주인 이유도..

이런 부분을 데브피아 식구들과 토론해 보기 위해서 입니다.




-------------------------------------
7. 마치며
-------------------------------------

음.. 이번에는 한번에 씨리즈를 다 안올리고.. 한편 작성이 완료될때마다 그때 그때 올릴 생각입니다.

첫회에서는 제 강좌의 방향에 대해서 주로 설명해 드렸고..

그 첫 단추로는.. 윈도우에 대한 이야기를.. 메모리의 관점에서 이야기 해 보았습니다..

과연.. 읽는 입장에서 얼마나 유익하게 받아드릴지는 걱정되네요..

다음편에선 가상메모리와 프로세스이야기를 잠깐 해보고 스택에 대한 이야기를 할 계획입니다.

모두 좋은하루 보내시고

행복하시길 바랍니다.

수고하셨고

끝까지 읽어주셔서 감사합니다.




마침.

18:36  3 Dec, 2002

Written by Un-Wook




=============================================

        배열과 포인터는 전혀 다르다 # 2

           - 가상메모리와 프로세스 -


                13 Dec, 2002

             Written by Un-Wook

=============================================




- 차례 -

1. 서문
2. 메모리의 한계
3. 프로그램의 시작과 끝
4. 마치며


-----------------------------
1. 서문
-----------------------------

요즘 날씨가 많이 쌀쌀합니다. 전 감기 안걸렸었는데 순전히 담배 때문에 감기 걸린것 같네요.

담배를 줄여야 하는데 참 걱정이네요..

코딩하려고 키보드 잡으면

혹은 스타크래프트 플레이할 때 절정에 다다렀다가 거의 이겨갈때 쯤...

저도 모르게.. 검지 손가락과 중지손가락 사이에 껴있는 담배 한개피를 발견합니다.

님들아 담배는 건강에 무지 해로우니까 담배 줄이도록 노력하시고

자 그럼 2 회 강좌를 시작해 보겠습니다.

이번 편에서는 프로그램이 실행되는 원리를 이야기해 보려는게 목표입니다.




-------------------------------------
2. 메모리의 한계
-------------------------------------

메모리는 참 중요한 것입니다.. 프로그램이라는 것이 메모리를 통하여 모든것을 구현하거든요..

프로그램 자체도 실행될때는 메모리에 로드되어 있는 것이고, 변수들도 죄다 메모리에 있는것이고

심지어.. 우리가 밥 지을때 사용하는 전기 밥통도 메모리가 있습니다.




1회 강좌에서 WIN32 는 32비트 레지스터로 메모리를 포인팅하며..

그 수치는 4 GB 까지 가능하다고 설명했습니다..

약 10년전에 1MB 에 4만원에 거래되던 시절이 있었습니다.

메모리를 32 메가를 작창하려면 메모리 값만 돈 백은 됐고.. 갑부집 아들의 돈지랄이죠..

보통 PC에서는 4 MB 를 장착했어요.

메모리 가격이 지금은 256 MB 가 보통 10만원 정도 하나요?

시대가 좋아져서 2002 년도의 보급형 PC 는 대부분 256 MB 를 장착하고 있습니다..

그런데 WIN32 란 것은 메모리를 4GB 까지 논리적으로 억세스 한다니..

게다가 OS 에서 사용되는 전체 메모리가 4GB 가 아니라..

어플리케이션 하나를 새로 띄울때마다 4GB 가 할당됩니다..

뭔가 어불성설 같은데..

알고보면 그안에는 숨겨진 트릭이 잇습니다.

"가상메모리 시스템"라는 것인데요..

프로그래머 아니신 분들도 WIN32가 가상메모리를 사용한 다는 것을 익히 들으셔서 아실 것입니다.

제가 이 강좌에서 가상메모리를 설명하려는건 아니고.. 그냥 훑어보는 것입니다.




WIN32 에서는 어플리케이션 하나당.. 4GB 의 고유의 메모리 영역이 확보됩니다.

근데 실은 말이 4GB 이지.. 가상메모리라는게 돌아가요..

메모리 사용되는 구간만 페이지로 나눠서

실제 메모리와 보조 장치 사이에서 페이징이 돌아가요..

그 보조장치는.. 하드디스크이구요..

보통 하드디스크에 스왑파일이라고.. 들어보셨지요?.. 이것이 가상메모리를 처리하기 위한 파일입니다..

윈도95/98 에서는 win386.swp 인것 같았는데 NT 버전쪽에서는 모르겠네여..

메모리는 전기적 성질로 비트를 기록하고, 디스크는 자기적 성질로 비트를 저장합니다.

둘다 어쨋거나 데이터의 근본은 비트입니다.

그렇기에 이런 동작이 가능한 것이구요..




가상메모리 시스템이 실제 물리적인 메모리의 내용을 하드디스크로 보관해 두는 것을 "페이지 아웃"

디스크의 내용을 메모리로 옮기는 것을 "페이지 인" 이라고 하는데

용어는 모르셔도 되고.. 암튼..




컴푸터에 메모리가 256MB 달려있어도.. 여러분이 작성하는 어플리케이션은

가상메모리 방식으로 보조장치와의 페이징을 통하여

4GB 라는 논리적인 메모리 영역을 사용할 수 있다는 것을 알아두셔욤.

각각의 모든 어플리케이션이 실행될때 4GB 씩 할당되고..

우리는 프로그래밍할때 가상메모리고 나발이고 생각 할 필요 없이

그냥 WIN32 에서 메모리는 선형으로 무한정 사용할 수가 있다고 생각하십시오..

선형이라는 말은 메모리의 주소가 0x00000000 부터 0xFFFFFFFF 까지

쭈욱 이어졌다고 생각할 수 있다는 것을 의미입니다. 4GB 란 수치는 실로 어마어마한 수치입니다.

여러분의 어플리케이션은 0x00000000 부터 0xFFFFFFFF 까지 4GB 라는 메모리를 접근할 수 있습니다.




그렇다고 너무 좋아하진 마세요..

가상메모리는 제어판에서 사용량의 한계를 두기도 하고.. 하드디스크 모잘라면 뻑납니다.

게다가 속도도 좀 느려요..

비트강좌에서 강조 했던거 번복하자면.. 프로그램은 메모리를 최적으로 사용해야 멋진 프로그램입니다.




그래도 프로그래밍할때 물리적인 메모리를 직접 관리하지 않도록 처리해주는 WIN32의 가상메모리 시스템은

프로그래머들에게는 아주 큰 메리트로 작용됩니다.




-------------------------------------
3. 프로그램의 시작과 끝
-------------------------------------

앞으로 스택과 힙을 설명해야 하는데..

"프로세스" 이야기도 잠깐 설명하고 넘어가야 할것 같네요..

프로세스라는 말을 많이 들어보셨을꺼에요..

프로세스와 프로세서를 혼동하지 마세요.. 프로세서는 CPU 말하는 거고..

프로세스는 좀 다릅니다..




프로세스가 머냐믄.. 복잡하게 설명 안하겟습니다..

그냥 프로그램 하나가 실행될때 확보되는 4GB 의 메모리 공간이 프로세스 입니다.

이 4GB 라는 공간은 논리적인 사이즈입니다. 가상메모리 시스템이 돌아가니까요.




하나의 프로그램이 시작하는 것은 하나의 프로세스가 생성되는 것입니다.

이 프로세스에는 EXE 이미지가 고대로 로드됩니다.

무슨말이냐면..

하드 디스크에 비트로 기록되어있는 EXE 파일이

프로세스에 별다른 번역이 전혀 없이 그 바이너리가 고대로 복사된다는 말입니다.

EXE 파일을 하나의 바이너리 이미지라고 볼 수 있는 것입니다. CPU 가 실행하는 기계어코드 입니다.




여기서부터는 조금 생소한 얘기일수도 있고.. 어려울수도 있으니..

조금만 집중하셔서 읽어보세요.. 집중하셔서 읽어보면 다 이해가 됩니다..

일딴 EXE 이미지가 프로세스에 로드되게 되면..

EXE 이미지의 개개의 바이트는 모두 고유의 주소값을 가지게 되고 (모든 주소값은 바이트 단위)

CPU 는 EXE 이미지가 시작되는 주소에서 부터 EXE 이미지의 코드를 하나씩 차례차례 실행해 나갑니다..

그 실행중인 주소값을 "프로그램 카운트" 라고 하구요

CPU 에는 이런것을 처리하기 위한 32비트의 "카운터 레지스터"가 있습니다..

이 카운터 레지스터가 바로.. 프로그램의 흐름을 책임집니다..

이 카운터 레지스터에 담긴 값은.. 바로 프로세스에서 현재 실행중인 코드 주소를 의미합니다.

보통 이 프로그램 카운터는 실행 코드 한단위가 실행될 때마다 값이 그 증가해 나가지만..

점프라는 것도 있습니다. 리턴이라는것도 있구요.

카운터 레지스터에 함수가 존재하는 코드의 시작 주소가 들어가면.. 프로그램 흐름이 변형되고

바로 함수 호출이 일어나는 것입니다.

if 와 같은 조건문도 실은 점프가 발생합니다.




여기 까지 읽으셨으면 프로그램이 어떻게 구동되는 것인가에 대해서도 대충은 감이 잡히실 겁니다.

프로세스 영역은 4GB 라고 했는데.. 실행파일은 그거보다 훨씬 작지요?.

프로세스에서 EXE이미지를 적재하고 남은 공간에다가.. 프로그램이 런타임시에(실행중일때)

메모리를 확보하거나 반환하면서 그 공간을 이용하는 것입니다.

정적 메모리 / 동적 메모리의 할당.. 모두 EXE 를 로드하고 남은 프로세스 영역을 사용합니다.




이밖에도 프로세스에는 DLL 들이라거나, 메모리맵, 가상디바이스, 페이지테이블.. 등등..

프로그램에서 사용될 모든 정보가 로드됩니다.

CTRL+SHIFT+ESC 키 눌러보세요.

작업관리자라고 나오죠? 다른 말로는 태스킹 메니져라고 하는 건데..

프로세스 탭을 보시면 현재 돌아가구있는 프로세스의 모든 목록을 볼 수 있습니다.

혹은 Spy++ 라는 유틸로 보셔두 되구요.. pview 라는 유틸도 제공됩니다.




-------------------------------------
4. 마치며
-------------------------------------

첫회 강좌를 너무 길고 어찌보면 지루할 듯한 이야기를 써서

여러분의 관심도를 떨어트리는건 아닌지 모르겠네요..

첫회 강좌에서 윈도우 이야기는 2회로 빼올껄 그랬어요..

앞으론 읽기 좋게 짧막 짧막하게 나누겠습니다.

2회에서는 가상메모리와 프로세스에 대하여 주로 설명을 하였습니다..

이제 3 회루 넘어갑니다..  3회에서 스택이 뭔가를 알아봅시다.

3회를 읽어주시와요~

수고하셨고

끝까지 읽어주셔서 감사합니다.




마침.

20:03:15   13 Dec, 2002

Written by Un-Wook






=============================================
        배열과 포인터는 전혀 다르다 # 3

                 - 스택과 힙 -

                13 Dec, 2002
             Written by Un-Wook
=============================================




- 차례 -

1. 서문
2. 프로세스를 조금만 더 알아보자
3. 스택이란?
4. 힙이란?
5. 마치며


-----------------------------
1. 서문
-----------------------------

오늘도 앉은 자리에서 연속으로 강좌를 써나갑니다 ㅡㅡ;;
담배는 수북히 쌓여가고.. 날씨는 드럽게 추워서 창문도 못열어 놓겠네요..
잡소리 집어치우구 3 회 시작하겠습니다..
이제 프로세스는 감을 잡으셨을테니
스택과 힙에대하여 이야기 해보는 것을 이번강좌의 목표로 잡지요..



-------------------------------------
2. 프로세스를 조금만 더 알아보자
-------------------------------------

기왕 2회 강좌에서 프로세스를 설명했으니.. 쬐꼼만 더 자세히 알아봅시다..
그래야 스택과 힙의 설명이 자연스럽게 이어질 것 같아요.


하나의 프로세스는 4GB 이지만.. 실제로 동적할당과 정적할당에 사용되는 영역은 4GB 의 반절인 2GB 입니다.
이유는.. MS 가서 따지셔요.. MS 에서 설계한 것입니다. ㅋㅋㅋㅋ
넝담이거.. 이유가 있어서 그렇게 설계 한 것이에요.


사용자 삽입 이미지

                                                                         <그림 3-1>



위 그림은 2개의 프로세스의 내부 구조를 도식화한 것 입니다.
Inside Visual C++ 5 라는 책에서 추출했음을 밝히고...  그거 쪼금 제가 수정한겁니다..
무단전재라면 당장 삭제하겠습니다. 근데 제 생각엔 올려도 괜찮을 것 같습니다.
스캐너 사니까 참 좋네요 책을 스캔도 하고 ㅋㅋㅋㅋ

암튼..
그림과 같이 실제 응용프로그램은 하위 2GB 만 사용합니다..
상위 2GB 는 웃기게도 모든 프로세스가 담구 있는 값이 똑같아요..
사실은 상위 부분은 모든 프로세스에 있는 것이 아니라.. 하나만 있고, 공유를 한다는 의미이지요.

(그렇다고 해도.. 하나의 프로세스에 선형 주소값으로 상위까지 표현이 가능합니다.)
API호출등을 제외하고 어플리케이션이 주로 접근하는 영역은 하위 2GB 인 셈입니다..
그림상으로는 하위 부분이 훨씬 공간이 넓어보이지만.. 상위 2GB 와 하위 2GB 의 크기는 똑같습니다.


상위 부분은 주로 공유될 리소스라거나 공유 되는 DLL 들이 로드되고
하위 부분에 2회강좌에서 설명해 드렸던 EXE 이미지가 로드됩니다.
그 밖의 공간을 "스택"으로 사용하거나, 또는 "힙"이 될수도 있습니다.
하위 부분에서 주소값이 높은 부분에다가는 DLL 들이 로드 되구요..
우리가 중요하게 봐야할 부분은 하위 부분입니다..!!


EXE 이미지가 프로세스에 로드되는 위치를 보면 0x00000000 부터 로드가 안되고
0x00400000 부터 로드가 되는 것은
0x00000000 부터 0x003FFFFF 까지는 MS-DOS 프로그램들을 에뮬레이션 하거나
WIN32 의 구버전인 WIN16 을 돌리기위한 영역으로 예약이 되어 있기 때문입니다. (WIN98 의 경우..)
WIN32 플랫폼 기반의 EXE 이미지는 0X00400000 부터 로드가 됩니다.



-------------------------------------
3. 스택이란?
-------------------------------------

스택을 설명하기 위해서 지금까지 이렇게 길고 긴 이야기를 진행해 왔습니다.

지금까지의 길고 긴 이야기가.. 바로 스택을 설명하기위한.. 베이스였습니다.




스택이란 두가지 의미로 해석될 수 있습니다..

자료구조에서 본 스택이라는 자료구조와, 실제 프로세스에 존재하는 스택 메모리입니다..

스택메모리는 프로세스의 어느 구간에 존재하고 있다고 말씀드렸었고,

이번 회에서는 자료구조면에서의 스택의을 먼저 설명하고나서..

다음 회에서 본격적으로 스택 메모리를 이야기해 보겠습니다.

워드프로세서 필기 시험에는 스택에 대한 내용이 나오는데요.. 혹은 전산계열 학과에서 스택을 배우죠

여기서 말하는 스택은.. 대부분 자료구조 측면에서의 스택입니다.




그것이 무엇이냐면.. 설명하는 거보다 실생활에서 아주 끝내주게 좋은 예가 하나 있습니다.

택시 자주 애용하시나요?..

술마시다가 차 시간 놓쳐서 택시를 자주 타게 되지요??

택시값 내구 나면 잔돈 거슬러 받아야되는데

유심히 관찰해 보시면.. 모든 택시에는 동전 빼주는 간단한 장치가 있습니다.

사용자 삽입 이미지

<그림 3-2>                                       



사진을 찾아보려고 했는데 찾기가 쉽지 않아서 직접 그려보았습니다.
동전은 원통형의 공간에 들어가고.. 원통 아랫쪽엔 스프링이 달려서 동전을 밀어 내줍니다.
택시 기사 아자씨가 차끌고 일하러 나가기전에, 그 기계에 동전을 차곡 차곡 꽂아넣습니다. (push)
그리고 손님에게 동전 거실러 줄 때 위에서부터 동전 한개씩 빼냅니다. (pop)
이게 스택 자료구조 입니다.
이거 만큼 뿅가게 스택을 설명하기 좋은 예가 없다고 생각하는데 .... ㅋㅋㅋㅋ
어떤분이 오바이트를 스택에 비유한 글을 봤는데..
오바이트는 뱃속에서 한번 섞였다가 입밖으로 나오는거잖아요..
발상은 기발하지만.. 오바이트는 스택이라고 볼수 없습니다.^^


그리고 참고로 알아두세요..
버스에 달려있는 동전교환기는.. 스택이 아니라 큐입니다.
버스에 달려있는 동전교환기는 다 아시죠?
원통에 동전이 차곡차곡 쌓여있고, 아랫쪽 동전부터 빠져나옵니다.


보통 스택 자료구조를 LIFO 라구 하는걸 들어보셨나요?
Last In First Out 입니다..
말그대로 마지막에 저장한 데이터는 처음 얻어는 메카니즘입니다.
처음 집어넣은 데이터는.. 잴 마지막에 얻어지구요..
이게 컴퓨터에서는 메모리 영역 한 부분이 이런식으로 동작하고..
그 메모리 영역을 바로..바로.. 스택이라고 부르는 것입니다.
스택이 불리우는 영역이.. 스택이라는 자료구조 형식으로 동작한다고 봐야 맞지요.


컴퓨터가 자동적으로 스택을 처리해주는 것은 아니고..
다 프로그램을 통해서 스택처리가 되는 것이구요. CPU 에 스택 관련 명령이 있습니다.
스택이라는 자료구조는 컴퓨터에서는 매우 중요한 작용을 합니다.
스택을 생각해내지 못했다면 많은 변수의 사용이나, 함수호출은 꿈도 꾸지 못했을 것입니다.


그리고 스택은 프로세스가 생성될때 필요한 만큼의 할당되어 집니다. (고정사이즈 입니다.)
스택 오버플로우라던가, 스택 언더플로우를 격어보신분은 아실텐데..
스택이 고정사이즈이기 때문에 발생하는 에러입니다.



-------------------------------------
6. 힙이란
-------------------------------------

스택메모리의 존재감에 대해선 느끼셨겠고..
이젠 힙을 알아봅시다.
프로세스에 EXE 이미지가 로드되고, 할당되고, 이것저것 필요한 동적 라이브러리가 로드되고
사용되지 않는 미사용 구간이 있는 것은 분명한데..
그 미사용 영역이 "힙"입니다.
프로그램 짜실때.. new 라던가 malloc() 류 함수를 이용한 동적할당이란 것을 아실텐데..
동적할당을 하게 되면.. 힙영역이 사용가능 하도록 잡히게 됩니다.


필요한 메모리 사이즈 만큼 OS 에게 할당해달라고 부탁할수 있고..  (new)
사용 다 했으면 다시 OS 에게 넘겨줘야합니다. (delete)

   char    *p= new char [1000];

위와 같은 코드가 런타임시 힙영역에 메모리를 1000 바이트 할당하는 동작을 합니다.
할당했으면.. 반환도 해줘야겠지요..  delete p;


참고로.. 힙을 마구 할당하고 반환시키다가 보면 선형 메모리의 중간중간이 끊어지게 되는데..
다른 말로 표현하자면, 메모리 블럭이 여러 조각으로 나뉘게 되어 비효율적이 되버리는데..
이 것을 해결하기 위한.. "가비지 콜렉션"이라는게 있다는 것도 알아둡시다.


-------------------------------------
5. 마치며
-------------------------------------

강좌 한편 한편 작성되는 족족 게시판에 등록하려고 했는데..
각 회마다 조율해야 점도 많고 소단원을 다른 회로 옮길 필요성도 있고..
그래서 그냥 다 써놓고 올리는게 속편한거 같아요..
이제 스택과 힙의가 어느정도 이해가 되시나요?
그럼 4 회루 넘어갑니다.
수고하셨고
끝까지 읽어주셔서 감사합니다.



마침.
21:28:39   13 Dec, 2002
Written by Un-Wook




=============================================
        배열과 포인터는 전혀 다르다 # 4

              - 변수와 메모리 -

                13 Dec, 2002
             Written by Un-Wook
=============================================




- 차례 -

1. 서문
2. 스택 내부에서의 할당과 반환
3. 일반변수의 사용 (스택의 용도 1)
4. 포인터 변수의 사용
5. 함수 호출후 복귀 (스택의 용도 2)
6. 마치며


-----------------------------
1. 서문
-----------------------------

자 이제 크라이맥스에 다다러 갑니다.

조금만 힘 내십시오.. 저도 장시간 타이핑해서 좀 지치는데.. 힘내서 쓰겠습니다..

이제 스택에 대해서 아셨으니, 이번 회에서는 스택이 어떻게 사용하며 그 중요성에 대해서 말해보겠습니다.

1회에 제기했던 의문점의 실마리가 조금씩 잡혀가고 있습니다.

4회 시작하겠습니다.




-------------------------------------
2. 스택 내부에서의 할당과 반환
-------------------------------------

스택에 대해서 3회에서 설명해 드렸지요?

프로세스 생성시에 스택은 정적으로 프로세스 공간에 할당됩니다.

그런데 한가지 재밋는 점은..

스택 내부에서도 할당과 반환이 이루어 진다는 것입니다.




예를들어 스택공간이 1000 BYTE 라고 치면..

이 스택의 상대적인 주소값은 0 ~ 999 까지 갖을 수가 있겠지요.

이 비어있는 스택에 1바이트 값을 하나 넣어주면

1바이트가 할당되는 것이라고 이해할 수가 있습니다.

1바이트 값을 하나 스택에서 빼오는 것은..

스택에서 1바이트를 반환(소멸)하는 것과 의미가 같습니다.




이런 스택의 할당과 반환을 처리하기 위해서 CPU 에는 "스택 포인터"라는 레지스터가 있습니다.

위의 예를 이어서.. 계속 예를들어보지요..

1000 바이트 공간의 스택이 있다면..

스택포인터에는 초기값으로 999 라는 값이 들어가있습니다.

스택에 1바이트를 할당하면서 데이터를 넣어주면

스택포인터가 999 이므로 스택의 999 번지에 데이터를 넣고..

스택포인터는 998 로 감소 됩니다..

또 한번 데이터를 넣어주면

스택포인터가 현재 998 임으로.. 스택의 998 번지에 데이터를 넣고

스택포인터는 997 로 감소됩니다..




반대로 데이터를 하나 얻어오면

스택포인터는 998 로 증가하고

스택의 998 번지에 있는 데이터를 리턴해줍니다.

또 한번 데이터를 얻어오려면

스택포인터는 999 로 증가하고

스택의 999 번지에 있는 데이터를 리턴해 줍니다..




이게 스택의 실제 동작입니다.. 그.. 택시기사님들이 사용하는 동전교환기랑 동작이 같습니다.

스택포인터란 것으로 스택이 작동하며..

위 예에서는 1바이트씩 넣고 빼고 하는 동작을 설명했는데

4 바이트씩 넣고 빼고 할수도 있고..

스택 포인터를 조작하여 스택 내부에 가변적인 크기를 할당해 놓을 수도 있습니다..

넣고 뺀다고 표현하니 먼가 점 그러네여... ㅋㅋㅋ




참고로

이 스택 동작을 이해하시면..

어플리케이션에서.. Undo 와 Redo 기능을 구현할 수 있습니다.

Undo/Redo가 저런식이거든요..

담에 Undo/Redo 를 구현하는 강좌를 한번 써볼까 합니다.




-------------------------------------
3. 일반변수의 사용 (스택의 용도 1)
-------------------------------------

이 스택이라는 메모리 공간에는 우리가 변수로 잡아준 것들이

위에서 설명한 방식으로 할당되고 반환됩니다.

외부 정적 변수를 제외하고..

보통 자동변수라고 함수 내에서 선언하는 변수들은..  스택내부에 확보됩니다..

글구.. 고정되게 위치하는 것이 아니고...위에서 설명한 것처럼

동적으로 스택에 확보됩니다.

   int    nTest;

위와 같은 변수는.. 위의 코드 진입시 4바이트가 스택에 확보되고.. 그 스택메모리가 변수로 사용됩니다.

블럭이 닫히는 지점에서 스택 포인터 값이 변경(증가)되며

할당(확보)되어있던 부분이 소멸(반환)되구요.




배열변수도 마찬가지 입니다.

   void MyFunc(void)
   {
       char   cTest[10];
   }

위의 코드는.. 프로그램이 MyFunc() 로 진입시.. 스택에 10 바이트를 할당하고..

그 할당된 스택 메모리가 변수를 담는 공간으로 이용되는 것입니다.

(10 바이트만 할당되는 것은 아닙니다. 함수호출 자체가 스택을 사용하기 때문에
기본적으로 확보되야할 스택에다가 덤으로 10 바이트를 할당합니다.)




아래와 같은 코드에서는

   char    cTest[]= "01ABC";

우선 스택에 문자열 길이만큼의 6 바이트가 할당되고

그 스택 메모리로 "01ABC" + NULL CODE 가 복사됩니다..

포인터의 의미를 이해하지는 분들은 제가 1회 강좌에서 제시했던 문제의 실마리를 잡으셨을 것입니다.




그리고 보충설명을 드리자면..

변수가 항상 스택에 할당되는 것은 아닙니다.. 하지만 대체로 스택에 할당됩니다.

네이티브 코드를 생성하는 컴파일러의 재량에 달린 문제이거나.. 최적화 옵션이 영향을 줍니다.

CPU 레지스터를 바로 변수 공간으로 사용되는 경우도 많습니다.




-------------------------------------
4. 포인터 변수의 사용
-------------------------------------

포인터는 중요성이 넓리 알려져 있고.. 강좌로 다루시는 분들도 많기 때문에

특별히 제가 설명하지는 않겠습니다..




한가지 강조하고 싶은점은.. 포인터 변수라고 특별날 것이 없다는 검니다..

그냥 일반변수처럼.. 포인터 변수 또한.. 스택이라는 공간에 잡힙니다.

단지 포인터 변수는, 그 변수에 담겨있는 값이.. 메모리 주소 값(수치) 라는 것 뿐이지..

일반 변수와 다를 것이 없습니다.




아래의 코드는 new 의 동작을 설명하는 것인데..

   char    *p= new char [1000];

힙에다가 1000 바이트 할당을 요구하고..  할당된 메모리의 시작 지점 주소(수치)가 리턴되어

p 라는 변수에 대입됩니다.

p 변수 자체가 1000 바이트가 할당된게 아닌 것이죠...

단지 1000 바이트의 힙 블럭을 할당하고, 그 블럭의 시작 주소를 p 라는 변수가 포인팅 하는 것입니다.




char* 때문에 혼동되실지도 모르겠지만..

WIN32 에서 char *p, short *p, int *p 등으로 선언된 모든 포인터 변수는 그 type과는 상관 없이

모두 32비트 입니다.. (4바이트)

32 비트 주소값을 담기 위한 변수는 그 크기가 32 비트여야 하기 때문입니다.

MS-DOS 에서는 모든 포인터 변수는 16 비트 크기였습니다.




요약해보면 포인터 변수는 그냥 일반 변수와 똑같고.. 사이즈는 언제나 32 비트 라는 것입니다.

안에 담겨있는 값이 단지 주소라는 것 뿐이지요.

변수 자체는 일반 변수처럼 스택에 할당됩니다.!!!!

단지 C 라는 컴파일러에서 포인터 변수라는 의미를 부여하는 것입니다.




-------------------------------------
5. 함수 호출후 복귀 (스택의 용도 2)
-------------------------------------

이 소단원은 그냥 참고 하시라고 써보는 것이니..

일딴 읽지 마시고 마지막 강좌까지 읽고 나신 다음에 읽어보세요.




"프로그램 카운터"라는 것을 2회인가? 에서 설명을 했던것 같습니다.

함수 호출시에는 "프로그램 카운터" 값을 스택에 일단 처박아주구 나서

함수를 호출합니다..  

2 회에서 설명했던 내용이기는 한데..

호출이라는 것은 그냥 점프 입니다. 프로그램 카운트 값을 변경해주는 것이에요..

현제 실행중인 프로세스의 EXE 이미지 주소값을 변경해 주는것이.. 함수 호출입니다..

API 호출도 원리는 같아요..

단 이때.. 함수를 호출하기 직전에.. 프로그램 카운트 값을 스택에 한번 박아주고 호출한다는 것입니다.

그 호출된 함수가 종료되면(리턴되면).. CPU 는 스택에서 최근 쳐박혀진 프로그램 카운트 값을 빼오고..

현제의 프로그램 카운트를 빼온 값으로 변경해 줍니다.




그럼 프로그램은 함수 호출후에 다시 원래대로 카운트가 증가해 나가면서 실행되어 나가는 것입니다.

이것이 함수호출의 원리 이고..

프로세스의 스택메모리가 사용되는 또다른 예 입니다.




-------------------------------------
6. 마치며
-------------------------------------

이제 다 설명한 것 같네요..

지금 까지 설명된 내용을 바탕으로 5 회에서는 1 회에서 제기했던 문제를 이야기 해보며 강좌를 마칠까 합니다.

그럼 5 회로 넘어가겠습니다.

끝까지 읽어주셔서 감사드리고

수고하셨습니다.




마침.

22:56:32   13 Dec, 2002

Written by Un-Wook




=============================================

        배열과 포인터는 전혀 다르다 # 5

          - 배열과 포인터의 차이점 -


                14 Dec, 2002

             Written by Un-Wook

=============================================




- 차례 -

1. 서문
2. 문제의 해결 1
3. 문제의 해결 2
4. 포인터 연산자
5. 정리
6. 마치며


-----------------------------
1. 서문
-----------------------------

이제 마지막 5회 입니다.

지금까지 설명된 내용을 바탕으로 1 회에서 제시한 문제를 풀어봅시다.

여러분은 지금까지 1회에서의 제기된 그 문제를 설명하기 위해서

지금까지 기반 지식들을 학습해 오셨고

이제 그 지식들을 이용해서 해결할 때가 온 것 입니다.

아래 내용을 읽으시기전에 제가 지금까지 설명해 드린... 프로세스, EXE 이미지, 스택, 힙 을 이해하셔야 됩니다..

마지막 회 시작하겠습니다.




-------------------------------------
2. 문제의 해결 1
-------------------------------------

   char    *pTest= "01ABC";
   char    cTest[]= "01ABC";

이 두 라인의 차이점이 우리가 해결한 문제였지요.

위 코드를 컴파일하여 EXE 파일을 얻으면.. EXE 파일 내부에는 "01ABC" 라는 스트링이 들어가있습니다.

무슨말이냐믄...

C언어로 코딩하실때.. 큰따옴표 안의 스트링은...  EXE 파일로 만들어지면.. 죄다 EXE 파일에 뒷쪽에 들어가게됩니다.

(EXE 이미지에서 스트링은 코드부분에 들어가있지 않고 따로 존재합니다.  
데이터 세그먼트라고 부르는 구간에 들어가있습니다.)

여튼... "01ABC" 라는 문자열은 EXE 파일 내부에 있고.. 프로그램 실행시에는 EXE 파일 자체가 번역없이 프로세스에 로딩됩니다.

그 로딩된 EXE 이미지의 "01ABC" 라는 문자열이 런타임시엔 상수처럼 사용되지요..




위 코드에서 pTest는 단지 런타임시에 4 바이트 포인터 변수로서 스택에 할당되고

단지 이 변수에는 "01ABC" 라는 스트링이 시작되는 주소를 넣는 코드입니다.

동적할당하고는 관계가 없고

그 pTest에 담겨진 주소는.. 프로세스에 로딩되어있는 EXE 이미지 구간 중 한부분입니다.




그리고..

cTest는 런타임시 스택에 6바이트가 할당되고

프로세스의 EXE 이미지 구간에서 "01ABC" 라는 문자열을 복사해옵니다.




결과적으로 pTest 가 포인팅하고 있는 메모리는 EXE 이미지인 것이며..

위의 코드에서는 pTest가 포인팅 하는 메모리는 할당된 힙이 아니라, 바로 EXE 이미지의 데이터 구간중 한 곳입니다.

위의 코드 바로 아래다가
   
   strcpy(pTest, "안녕");    // 포인터변수 pTest

저렇게 코딩하게 되면.. 컴파일 할때는 오류가 검사되지 않으나.. (문법상으로는 오류가 없기 때문입니다.)

런타임시에는 프로그램이 저 코드 부분에서 바로 죽어버립니다.

pTest 가 포인팅 하고 있는 메모리는 EXE 이미지이기 때문입니다.

EXE 이미지 구간은 오버라이트를 하면 안되죠..

DOS 플랫폼 같았으면 프로그램이 알수없게 동작하거나.. 시스템 자체가 먹통이 되버리는 상황이 발생 되었을 일입니다.




하지만

   strcpy(cTest, "안녕");  // 배열변수 cTest

이런 코드는.. 런타임 오류가 발생하지 않습니다..

이미 cTest 는 6 바이트라는 영역이 스택에 할당되어있기 때문입니다..

그 안엔 이미 "01ABC"라는 문자열이 복사되어져 와있습니다.

6바이트 이내로 안전하게.. 오버라이트가 가능합니다.




그리고 참고로.. pTest 라던가 cTest 라던가하는 변수 이름은..

네이티브 코드가 만들어질때.. 변수의 이름 자체는 의미가 없습니다..

단지 C언어라는 고급 프로그래밍 언어에서

소스 코드 작성하기 편리하도록 지원해주는 것일 뿐입니다.

변수라는 것은 프로그램 런타임시 단지 주소값을 갖는 메모리의 일 부분일 뿐입니다.




-------------------------------------
3. 문제의 해결 2
-------------------------------------

   char    *pTest= "01ABC";
   char    cTest[]= "01ABC";

   printf("pTest : %08x %08x \n", pTest, &pTest);
   printf("cTest : %08x %08x \n", cTest, &cTest);

   출력 결과----------

       pTest : 00407058 0012ff78
       cTest : 0012ff7c 0012ff7c

출력결과는 코딩을 어케 했느냐와.. 시스템에 따라 달라질 수 있습니다.

하지만 모든 시스템에서 두번째 라인에 출력되는 값 두개는 서로 동일합니다...

왜 두개가 서로 동일한 것인가가.. 우리가 풀어볼 문제였지요..




출력결과 pTest 를 보면

첫번째 수치 0x00407058 은 pTest 변수에 담긴 값입니다..

pTest에 담긴 이 값은 메모리 주소를 의미하고..

이 메모리 주소는 프로세스에 로딩된 실제 EXE 이미지의 한부분이죠.  (위에서 설명한 말입니다.)

두번째 강좌에서 0x00400000 부터 EXE 이미지가 로딩된다고 설명했었고..

실제로 pTest가 포인팅하는 주소는 0X0040000 과 매우 근접한 것을 확인 하실 수가 있습니다.

사용자 삽입 이미지




실제로 EXE 파일 덤프해보면 0x7058 오프셋부터 "01ABC" 라는 데이터가 있는 것도 확인됩니다.


사용자 삽입 이미지



그리고 두번째 수치 0x0012FF78 의 경우는 pTest 라는 변수가 할당된 스택 메모리의 주소입니다.




출력결과 cTest 를 보면.. (이것이 우리가 풀어볼 문제지요..)

좀 특이한데...

배열 변수는 [] 사용없이 배열 변수명만을 사용하면

변수명 자체가 그 배열변수가 스택에 위치한 주소값을 나타냅니다.

그 cTest 에 담겨 있는 값은 분명 "01ABC" 의 첫바이트인 '0' 이라는 값으로 봐야하지만..

cTest 라고 코딩하면 이것은 cTest안에 담긴 값이 아니라 cTest 자신의 주소값을 의미합니다.

결과적으로 C 로 코딩할때, char cTest[]="01ABC"; 라고 선언된 배열변수에 대하여

cTest는 &cTest 와 의미가 같고

둘다 &cTest[0] 을 의미하는 것 입니다..




이것이 배열이 포인터와는 다른 점입니다.

달라도 전혀 다른 것이지요.

포인터변수는 자신에게 담긴 값으로.. 다른 메모리를 포인팅 해주지만

배열변수는 스택에 메모리 배열이 할당되고, 변수명 자체가 자신의 주소값을 의미합니다.

이해를 돕고자 그림을 하나 그려보았습니다..

사용자 삽입 이미지





이제 좀 응용해서 설명해 보겠습니다.

(pTest + 2) 은 메모리에서 'A'가 담긴 주소값을 의미하고 (0x0042206C + 2) --> 32비트 수치 메모리 주소

pTest 라는 변수에는 주소값이 담겨있기 때문에 메모리 주소값에 2를 더해주는 것입니다.

그래서 pTest[2] 는 *(pTest + 2)를 의미합니다.  --> 8비트 수치 char 형 'A'


(cTest + 2) 도 메모리에서 'A'가 담긴 주소값을 의미합니다. (0x0012FF70 + 2) --> 32비트 수치 메모리 주소

하지만 cTest 라는 변수에는 메모리 주소값이 담겨있지 않습니다. 단지 cTest 가 &cTest를 의미하는 것입니다.

그래서 cTest[2] 의 경우에도 *(cTest + 2)를 의미하는 것이지만 --> 8비트 수치 char 형 'A'

cTest 엔 메모리 주소값이 담겨있는게 아니라 cTest 는 &cTest 와 동격인 것입니다.




지금까지 제가 한 말이 못미더우시면..

비주얼 씨의 디버깅 기능중에

프로세스 영역을 보여주는 기능이 있습니다..

View > Debug Window > Memory

프로그램 런타임상태에서.. 브레이크 포인트가 걸리게 하신담에

메모리 윈도우를 열으시고.. 메모리 주소를 트래이싱해 보시면

직접 확인해 보실 수 있습니다.




-------------------------------------
4. 포인터 연산자
-------------------------------------

이 소단원은 그냥 참고 용으로 써보는 내용입니다.

포인터변수의 선언과 포인터 연산자는.. 서로 다릅니다..

이미 포인터를 학습해 오시고 사용해 오시면서.. 익히 아실 것으로 압니다.




포인터의 선언은 포인터 변수를 선언 하는 것이고

(반복해서 설명해 드리지만.. 선언된 변수 자체는 런타임시 32비트 사이즈로 스택에 잡힙니다.

그리고 그 변수는 주소값을 담고 있으면서, 할당된 힙블럭을 포인팅한다거나 EXE 이미지의 데이터를 포인팅하는 것입니다.)




포인터 연산자는 어느 수치값(주소)이 의미하는 메모리주소에 담겨있는 실제 값을 얻어오거나 할때 사용하게 됩니다.

아래 코드에서 (char*) 는 캐스팅이고... 재일 왼쪽에 붙은 별이 포인터 연산자입니다.

   char  cA= *((char*)100);

위와 같은 코드는 메모리주소 100 에 담긴 값이 cA 라는 변수로 바로 얻어집니다. (실제 이런 코드는 사용안되지지만..)




WIN32에서 메모리 포인터는 죄다 32 비트라고 했는데

char *pTest; 라고 선언된것에서 이 char 타입이.. 바로 포인터연산자에 활약하는 것입니다..

short *Test; 라고 선언한 것에 포인터 연산자를 사용하면 2 바이트 short 값으로 얻어오게 되지요..




그리고 [] 자체도 연산자입니다. 포인터 연산자와 같은 동작을 합니다.. 명칭은 까먹엇어요.

ㅋㅋㅋ

언제나 드리는 말씀이지만.. 용어를 아는것 보다 원리를 아는 것이 더 중요합니다..

사람들이 규정한 용어라는 것은.. 원리를 이해하고 있다면 그냥 사전 찾아보시믄 됩니다.




-------------------------------------
5. 정리
-------------------------------------

이처럼.. 배열과 포인터변수는 코딩상에서 사용은 서로 유사하지만..

사실 그 내부 동작은 매우 차이가 납니다.

이러한 차이 때문에 발생하는 문제에 대해서도 말씀드렸구요..

우리가 의식하지 못했던..  스택이라는 것이 존재하기 때문입니다..

이것을 이해하는 것은 자신의 스킬을 한단계 끌여 올릴 수 있는 계기가 될 것입니다.

이강좌를 완독하셨다면..

지금까지 코딩하실때 그냥 그냥 사용했던 포인터 변수들과 배열/ 함수호출/ 함수진입 등이

조금은 다른 느낌으로 가슴에 와 닿으실 거라 생각됩니다.




-------------------------------------
6. 마치며
-------------------------------------

이제 막을 내릴 시간입니다.

이번 강좌는 지금까지 써왔던 강좌와는 좀 다르게

해결하기 위한 문제를 먼저 제시해 보고

그 문제를 풀기 위해 필요한 지식들을 설명해 나가는 방식으로 진행해 보았습니다..

기반 지식을 갖추게 되면 풀리는 문제이기 때문이기도 합니다.




스택에 대해서 용어만 알고 계셨던 분이라거나.. 사전적인 의미만 알고 계셨던 분이라거나..

여기 까지 읽으셨다면.. 감을 잡으셨을거라 생각이 됩니다..

중요하고 기초적인 것이면서도 왠만해서는 잘 안다뤄지고 있는 내용이라 써봤어요




"배열과 포인터는 전혀 다르다" 라는 제목으로 작성된 이 강좌에는

WIN32 플랫폼, 가상메모리, 프로세스, EXE 이미지, 프로그램 구동원리, 스택, 힙을 설명하였습니다.

강좌 제목은 여러분의 이목을 끌어보기 위한 타이틀이였고,

첫 회에 말씀드린 것 처럼 주로 메모리와 관련된 이야기였습니다.

다루어진 항목은 많은데 각 항목에 대해 세밀한 부분까지는 설명드리지 못 한것 같은 생각이 들어요..

제 딴에는 쉽게 풀어서 쓴다고 썻지만..

모호한 설명이라거나 난해하게 표현된 부분이 있을지도 모르구요..

글을 등록하고 난 후에도.. 발견하는 대로 수정하도록 하겠습니다.




요즘 날씨가 갑자기 추워졌지요..

감기걸려서 저처럼 고생하지 마시고.. 조심하세요..

수고하셨고

끝까지 읽어주셔서 감사드립니다.




마침.

00:00:00   14 Dec, 2002

Written by Un-Wook



Posted by theYoungman
engineering/System Eng.2007. 2. 26. 09:48

1회 | C 복습! 컴파일, 그리고 소스 분리하기
2회 | 포인터는 우스워
3회 | 에러없는 프로그램에 도전한다
4회 | 소스 분석하기
5회 | 디버깅하기
6회 | C로 임베디드 시스템 맛보기
7회 | 임베디드 리눅스 애플리케이션 개발하기



많은 프로그래머 지망생들이 꼭 배워야 하는 프로그래밍의 관문이라면 C와 C++를 꼽을 수 있습니다. 요즘은 훌륭한 툴 덕분에 아주 간편하게 프로그래밍을 할 수 있는 방법이 많지만 제대로 컴퓨터를 이해하기 위해서는 C와 C++는 한번은 꼭 거쳐야 할 관문입니다. 임베디드 프로그래밍 시대를 살아갈 독자들을 위해 준비한 이번 연재가 실제 프로그래밍을 하면서 사용하는 많은 테크닉을 배우는 ‘결정적’ 기회가 되기를 바랍니다.

언어처리에 관심이 많으며 맹목적으로 유닉스와 PDA를 추종하는 동물적 감각을 지녔다는 필자는 PDA는 비싼 장난감의 일종이라고 굳게 믿고 있다. 기계에 묻혀 살다보니 얼리 어댑터가 아니냐는 이야기를 자주 듣지만 결코 아니다! 필자는 유닉스 관련 동호회와 PDA 관련 동호회 몇 군데에 자주 출몰한다고 한다.

많은 사람들이 C를 배우기는 했지만 제대로 사용하지 못하는 경우를 많이 접하게 됩니다. 무언가 해보고는 싶지만 무엇을 해야 할 것인가, 또 어떻게 시작해야 할지, 하고는 싶지만 그저 막막한 기분에 멍하게 앉아 있다가 웹 서핑으로 시간을 보내는 경우가 대부분일 것입니다. 필자는 PHP를 이용해 웹 프로그래밍을 하기 위해서는 꼭 C를 이용해 처음부터 CGI를 만들어 본 경험이 있어야 한다고 생각합니다. 훌륭한 GUI 프로그램을 만들기 위해서는 MFC나 GTK+, Qt와 같은 툴킷을 사용해 보기 전에 먼저 WIN32 API나 Xlib와 같은 저수준의 라이브러리를 이용해 처음부터 C로 작성해 볼 필요가 있습니다. 그리고 훌륭한 IDE(Intergrated Development Environment)가 갖춰져 있는 개발툴을 이용해 프로그램을 작성하려면 반드시 에디터와 컴파일러만을 이용해 프로그램을 개발해 본 경험이 꼭 필요합니다. C 언어로 직접 작업을 하게 되는 시스템 프로그래머가 아니라도 이런 의미에서 C는 프로그래밍을 하려면 알아야 할 언어인 것입니다.


다시 C 언어에 도전하기
이번 연재는 C를 배우고 싶었지만 중도에 포기해 버렸던 독자들, C를 배우기는 했지만 아직 무언가 부족하다고 생각하는 독자들, 실제로 프로그래밍을 하면서 사용하는 많은 테크닉을 배우고 싶다고 생각하는 독자들을 위해 마련되었습니다. C에서 비교적 이해하기 힘든 내용들을 간단히 다시 살펴보고, 실제로 프로그래밍을 하면서 접하게 되는 상황에서 자주 사용하게 되는 테크닉을 적어보려고 합니다. 그리고 관심이 있을 독자들을 위해 임베디드 시스템에서의 프로그래밍에 대해서도 간략히 소개하겠습니다.
대부분의 기사는 리눅스 환경에서 vi, gcc, make를 이용하는 것을 전제로 합니다. 윈도우를 이용하는 사용자라면 cygwin을 이용하면 비슷한 환경을 이용할 수 있겠지요. 물론 비주얼 C++를 사용하는 독자도 cl.exe와 nmake.exe만을 이용한 콘솔 환경에 익숙해질 수 있도록 연습해보면 많은 도움이 되지만 지면 관계상 cl.exe와 nmake.exe의 사용에 대해서는 따로 다루지 않겠습니다. IDE라는 것은 이런 콘솔 환경을 뒷받침해주기 위한 도구에 불과하다는 것을 항상 기억하기 바랍니다. cygwin의 설치에 대해서는 cygwin 홈페이지(http://www.cygwin.com)를 참조하세요. 물론 필자도 윈도우 XP에서 MS 워드를 이용해 글을 쓰면서 cygwin을 이용해 샘플을 작성하고 있습니다.
이번 호에서는 C로 작성한 프로그램이 실행 파일이 되는 과정과 소스를 분리해 프로그램을 작성하는 방법에 대해 간략히 다루고자 합니다.

[ 정말 고급 개발자가 되고 싶다면! ]
gcc의 매뉴얼 페이지를 숙지하는 것이 좋습니다. 매뉴얼 페이지는 방대한 양도 양이지만, 컴파일러와 바이너리 구조에 대한 상세한 지식 없이는 이해가 불가능한 내용들이 대부분이죠. gcc의 매뉴얼 페이지를 제대로 이해할 수 있다는 생각이 든다면 그때는 자신의 프로그래밍 실력에 대해 어느 정도의 확신을 가져도 좋습니다. 물론 cl.exe의 MSDN 문서도 꼭 한번 읽어볼 것을 권합니다.



Gcc로 만든 C 프로그램이 실행되기까지
C를 언급하면 가장 먼저 시작하는 프로그램은 그 유명한 ‘hello world’라는 간단한 프로그램이지요(hello world 대신 ‘hello jiny’로 변경했습니다). 하지만 오늘은 이 프로그램을 조금 다른 용도로 사용하려고 합니다. 콘솔 환경에서 소스 코드를 컴파일하고 프로그램을 여러 개의 파일로 분리하는 방법, 그리고 여러 개의 파일로 되어 있는 프로젝트를 make를 이용해 관리하는 방법, 프로그램이 컴파일되어 실행되는 과정에 대해 간략히 알아보겠습니다.


자주 사용하게 되는 또 아주 가장 기본적인 gcc의 옵션 몇 가지를 적어 보았습니다. 보통은 <리스트 1>의 옵션들을 여러 가지로 조합하여 사용하지만 <리스트 1>에 적어둔 옵션들은 가장 ‘기본적’이고 많이 사용하는 옵션들이니 항상 숙지하고 있어야 합니다. 물론 I, -L, -l과 같은 옵션도 꼭 암기하고 있어야 합니다.
프로그램을 컴파일한다는 것은 대체 무슨 뜻일까요? 컴파일러는 어떤 과정을 거쳐서 실행 파일을 생성해주는 것일까요? 만일 처음 보는 환경에서 gcc를 이용해 실행 파일을 생성했는데 무언가 에러를 하나 보여주면서 실행이 되지 않는다면 이때 개발자들은 대체 무얼 해야 할까요? 이런 일은 ‘실제로도’ 자주 일어납니다. 이제 gcc의 옵션들을 무기로 이 hellojiny.c라는 프로그램이 컴파일되는 과정을 한번 살펴보도록 하겠습니다.
C 또는 C++는 기본적으로 Perl이나 파이썬, LISP, 베이직 등의 언어와 같이 소스 상태에서 바로 실행되는 언어가 아니라, 컴퓨터가 알아들을 수 있는 기계어로 변환된 이후에만 실행되는 언어입니다(물론 C 인터프리터도 없는 것은 아닙니다). C로 되어 있는 소스 형태를 어셈블리 언어로 바꾸는 프로그램을 컴파일러, 어셈블리 언어를 기계어로 바꾸는 프로그램을 어셈블러라고 합니다. 하지만 어셈블리 언어를 기계어로 변경했다고 바로 프로그램이 실행될 수 있는 것은 아닙니다. 자, 바로 여기에서 퀴즈 두 개를 내겠습니다.

① Hello world 프로그램에서 우리는 printf라는 함수를 사용했습니다. 이 함수는 어디에 있는 것일까요?
짿 C 프로그램은 main()이라는 함수에서 시작됩니다. 하지만 함수는 다른 함수가 호출해주기 전에는 실행되지 않습니다. 그러면 main 함수는 어떻게 시작되는 것일까요?

이 퀴즈의 답을 적기 전에 답을 이해하기 위해 필요한 내용을 좀더 적어보려고 합니다. 조금만 더 읽어 보세요. 소스 코드는 가장 먼저 전처리기(preprocessor)라는 프로그램을 이용해 다른 형태의 소스 코드로 변환됩니다. 헤더 파일과 소스 코드를 합쳐 새로운 소스 코드를 만들어 내는 것이 전처리기의 역할이지요. 프로그래머가 사용한 매크로나 매크로 함수 등도 전처리기를 통해 숫자나 코드로 치환됩니다. C 컴파일러는 전처리기를 통해 처리된 소스 코드만을 컴파일 할 수 있습니다. 그리고 C 컴파일러는 입력된 소스 코드를 몇 가지 마법(?)을 사용해 어셈블리 소스 코드로 변신시킵니다. 컴파일러가 프로그램을 최적화해 주는 것도 바로 이 컴파일러의 역할입니다.
어셈블리로 변신한 C 소스 코드는 다시 어셈블러를 통해 기계어 모음으로 변신합니다. 이렇게 태어난 기계어 파일을 우리는 오브젝트 파일이라고 부릅니다. 하지만 이 오브젝트 파일은 아직도 실행되지 않습니다. 물론 이 오브젝트 파일에는 00101110 따위의 기계어 실행 코드 말고도 아주 여러 가지의 암호가 함께 적혀 있습니다. 프로그램이 실행되려면 다시 몇 가지 정보가 더 필요합니다.
프로그램이 실행되기 위해서는 프로그램에서 어떤 라이브러리를 사용하는지, 프로그램에서 사용하는 함수들은 라이브러리에 다 있는지 확인해 이 정보들을 실행 파일에 포함시키는 과정이 필요합니다. 이 부분을 담당하는 것이 링커(linker)라는 프로그램입니다. 그리고 이런 정보를 써 넣는 형식을 실행 파일의 포맷이라고 부릅니다. 흔히 이야기하는 윈도우에서의 PE나 리눅스에서의 elf, a.out과 같은 포맷들이라고 생각하면 됩니다.
gcc는 이런 일을 하기 위한 프로그램의 모음이라고 생각할 수 있습니다. gcc 그 자체는 실제로는 소스 코드를 분석해 내부 정보로 변환하고(프론트엔드라고 합니다), 이 내부 정보를 어셈블리로 변환시키는 부분(백엔드라고 합니다)을 모아놓은 프로그램의 집합이고, 이후의 부분은(GNU의 경우) as, ld와 같은 별도의 프로그램이 담당합니다. 바이너리를 생성해 내기 위한 이런 툴들의 모음이 바로 GNU binutil이라는 것입니다. gcc에서 설명한 각 단계를 처리해주는 옵션들이 E, -S, -c 등이며 gcc 자체는 이 단계를 자동으로 처리해주는 스크립트라고 볼 수 있습니다. 즉 앞에서 설명한 E, -S, -c 옵션들을 이용하면 각 단계에서의 결과물을 얻어낼 수 있습니다. 자. 이제 퀴즈의 답을 적어 보겠습니다.

짾 printf 함수는 C의 기본 라이브러리입니다. C에서 기본적으로 제공되어야 하는 라이브러리들을 standard C library라고 하는데, 보통 리눅스나 freebsd 등의 운영체제에서는 GNU libc의 형태로 제공됩니다.
짿 윈도우에서 API를 이용해 프로그램을 해본 경험이 있는 독자라면 프로그램은 반드시 main에서 시작해야 하는 것이 아니라는 사실을 알고 있을 것입니다. C 프로그램이 main에서 시작해야 하는 이유는 그렇게 정해져 있기 때문입니다. 프로그램이 실행되기 위한 몇몇 환경을 맞추어 주는 코드를 startup 코드라고 보통 CRT라고 되어 있습니다. gcc든 VC++이든 모두 CRT 코드가 없으면 프로그램이 실행될 수 없습니다! 메인 함수는 이 CRT 코드에서 호출해 주게 되어 있습니다. 확인하고 싶은 독자가 있다면 약간의 어셈블리를 배워보는 것이 좋습니다. 임베디드 시스템에 관심이 있다면 CRT라는 이름을 접하게 되는 일이 종종 생길지도 모릅니다.

프로그램을 컴파일하는 과정에서 사용하게 되는 일은 거의 없다고 해도 좋지만 gcc는 정말 유용한 옵션을 하나 가지고 있습니다. ‘gcc의 실행과정 하나하나를 살펴볼 수 있게 해주는 v라는 옵션인데…’까지만 이야기했지만 호기심이 많은 독자들은 이미 실행을 해보고 있겠지요. 자, 필자가 지금의 글을 작성하고 있는 환경(윈도우 XP, cygwin) 에서 gcc v를 실행한 결과를 여기에 옮겨 적습니다. 자세한 옵션들은 환경에 따라 달라질 수도 있지만 중요한 내용과는 관련이 없습니다.

gcc -v hellojiny.c

Reading specs from /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/specs
Configured with: /GCC/gcc-3.3.1-3/configure --with-gcc (생략) --
build=i686-pc-cygwin
Thread model: posix
gcc version 3.3.1 (cygming special)
여기에서부터 컴파일이 시작됩니다. 결과물로 cckh80cG.s라는 어셈블리 파일이 생성되는 것을 알 수 있을 것입니다. 물론 include 파일에 대한 검색을 하고 있는 것도 확인할 수 있습니다.

/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/cc1.exe -quiet -v -D__GNUC__=3 -D__GNUC_MINOR__=3 -D__GNUC_PATCHLEVEL__=1 -D__CYGWIN32__ -D__CYGWIN__ -Dunix -D__unix__ -D__unix -idirafter /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/../../../../include/w32api -idirafter /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/../../../../i686-pc-cygwin/lib/../../include/w32api hellojiny.c -quiet -dumpbase hellojiny.c -auxbase hellojiny -version -o /cygdrive/c/DOCUME~1/saxboy/LOCALS~1/Temp/cckh80cG.s
GNU C version 3.3.1 (cygming special) (i686-pc-cygwin)
compiled by GNU C version 3.3.1 (cygming special).
GGC heuristics: --param ggc-min-expand=62 --param ggc-min-heapsize=61374
ignoring nonexistent directory “/usr/local/include”
ignoring nonexistent directory “/usr/i686-pc-cygwin/include”
ignoring duplicate directory “/usr/i686-pc-cygwin/lib/../../include/w32api”
#include “...” search starts here:
#include <...> search starts here:
/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/include
/usr/include
/usr/include/w32api
End of search list.
여기에서부터 어셈블러가 작동합니다. 앞에서 생성한 cckh80cG.s라는 어셈블리 파일을 ccaKWInj.o라는 오브젝트 파일로 변환했습니다.

/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/../../../../i686-pc-cygwin/bin/as.exe --traditional-format -o /cygdrive/c/DOCUME~1/saxboy/LOCALS~1/Temp/ccaKWInj.o /cygdrive/c/DOCUME~1/saxboy/
LOCALS~1/Temp/cckh80cG.s

이곳이 링커로 오브젝트 파일과 각종 라이브러리들을 이용해 최종 결과물인 실행 파일을 생성해내는 부분입니다. ‘Crt 어쩌고’ 라고 적혀 있는 부분에서 필자가 거짓말을 하고 있는 것이 아니라는 것은 증명됐습니다. Collect2라는 프로그램은 주어진 옵션으로 링커를 호출해 주는 프로그램입니다.

/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/collect2.exe -Bdynamic --dll-search-prefix=cyg /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/../../../crt0.o /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/crtbegin.o -L/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1 -L/usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/../../.. /cygdrive/c/DOCUME~1/saxboy/LOCALS~1/Temp/ccaKWInj.o -lgcc -lcygwin -luser32 -lkernel32 -ladvapi32 -lshell32 -lgcc /usr/lib/gcc-lib/i686-pc-cygwin/3.3.1/crtend.o

아주 간단하게 프로그래머가 만든 소스 코드가 바이너리 파일로 바뀌는 과정을 살펴보았지만 실제로 이 내용을 자세히 이해하기 위해서는 어셈블리 언어와 컴파일러의 구조, OS의 바이너리 로딩 등에 대해 약간의 지식이 더 필요합니다. 관심이 있는 독자들은 운영체제에서의 바이너리 포맷이나 바이너리 로딩에 관한 부분에 대해 좀더 깊게 공부해 보면 도움이 될 것입니다.

[ '관심이 있는' 독자에게 던지는 제언 ]
gcc hellojiny.c를 위해 gcc를 바로 사용하지 않고 직접 하나하나 명령을 실행해서 a.out으로 변환시켜 볼 것을 권하고 싶습니다. 특히 gcc -S를 이용해 생성된 어셈블리 결과물을 as와 ld를 이용해 직접 바이너리로 변환하는 과정을 직접 해 보면 프로그램이 만들어지는 과정과 실행되는 과정에 대해 많은 것을 얻을 수 있게 됩니다. 또 이렇게 얻어진 경험에 대해서 혹시라도 임베디드 시스템에서 바이너리를 만들어야 할 필요가 있다면 필자에게 감사하게 될 것입니다. 혹시 좀더 시간이 남는다면 gcc가 아닌 다른 컴파일러와 GNU as가 아닌 다른 어셈블러 등을 이용해 여러 가지를 실험해보는 것은 어떨까요. 미리 경고해두는데, 절대 간단하지 않습니다.



함수 사용, 파일 분리, 그리고 linkage
시작부터 조금 당혹스러운 내용이 되었을지도 모르겠습니다. 다시 눈높이를 약간만 낮춰 함수와 분할 컴파일, 그리고 분할 컴파일을 위한 make에 대해서 조금만 알아보도록 하겠습니다.
아주 당연한 질문이지만 왜 소스 코드를 여러 파일에 분리해서 작성해야 할까요? 꼭 이렇게 해야 할 필요는 없습니다. 프로그램을 작성하는 것은 결국 실행 파일을 만들어내기 위해서이고 따라서 1만 라인 정도 되는 프로그램이라 하더라도 소스 파일 하나에 프로그래밍해도 별로 관계는 없습니다. 실행 파일만 제대로 생성되면 상관없다는 의미입니다. 문제는 이것이 간단한 프로그램 몇 개를 만드는 정도라면 상驩平嗤?조금 프로젝트의 규모가 커지기 시작하면 관리가 불가능해진다는 데에 있습니다. 1만 라인 정도 되는 소스 코드를 한 파일에 작성해놓고 찾아다니면서 프로그램을 수정하는 것은 거의 불가능에 가깝습니다.
하지만 또 하나 중요한 이유가 있습니다. 컴파일에 걸리는 시간 때문입니다. 프로그램을 개발하면서 소스 코드를 컴파일하기 위해 사용하는 시간은 결코 무시할 수 없습니다. 컴파일에 걸리는 시간을 줄이기 위해서 빠른 컴파일러를 개발하는 것은 물론이고, 분산 컴파일, 헤더만 미리 컴파일하기(precom piled header) 등의 갖가지 방법이 개발됩니다. 그만큼 컴파일 시간은 프로그램의 개발에 중요한 요소입니다. 당장 필자가 문서를 작성하고 있는 워드프로그램을 컴파일하려면 시간이 얼마나 필요할까요? 한두 라인만을 수정하기 위해서 워드의 소스 코드를 전부 컴파일해야 한다면 얼마나 비효율적인 일이 될까요!
이제부터 독자들은 가능한 한 프로그램을 분할해서 작성하도록 노력해야 합니다. 이런 작업을 하기 가장 좋은 툴 중의 하나가 바로 make라는 것이다. 비주얼 C++에는 nmake. exe는 툴이 있습니다. Make와 문법은 약간 다르지만 사용하는 방법이 크게 다르지는 않습니다.
먼저 hellojiny 프로그램(<리스트 2>)을 함수를 이용해 바꿔 보았습니다. 아주 간단한 코드이니 독자들에게 전혀 무리가 없으리라 생각합니다. 하지만 다시 퀴즈입니다. 왜 print_hello() 함수의 앞에 static을 사용했을까요? 답은 파일을 분리한 hellojiny에서 설명하려고 합니다. 이제 두 함수를 각각의 파일로 분리해 보았습니다(<리스트 3>).
자, 이제 hellojiny 프로그램을 두 개의 파일로 나눠 보았다. 하지만 이 파일들은 몇 가지 심각한 문제가 있습니다. 이 문제를 발견하기 위해서 두 파일을 컴파일합니다.





gcc -Wall main.c s2b.c
main.c: In function `main’:
main.c:5: warning: implicit declaration of function `print_hello’
main.c:6: warning: control reaches end of non-void function

gcc의 -Wall 옵션은 컴파일하는 과정에서 발견된 문법적인 오류를 검사해 줍니다(더 자세한 문법 오류를 검사하기 위해서는 lint라는 별도의 프로그램을 사용할 수도 있습니다). 컴파일하면서 오류 메시지를 두 개 발견했는데 첫번째는 main.c에서 print_hello()라는 함수에 대해 알고 있지 못하다는 내용이고, 두번째는 main() 함수에서 리턴값을 돌려주지 않는다는 내용입니다. 두 가지 다 중요한 내용이지만 지금은 첫번째 문제에 관해서 좀더 생각해보겠습니다.
C는 선언(declaration)이 꼭 필요한 언어입니다. 함수를 호출하는 부분은 컴파일러에게는 함수 자체가 변수와 마찬가지로 생각한다고 해도 과언이 아닙니다. 함수의 반환형(return type)이 제대로 선언되지 않은 경우 컴파일러는 무조건 int를 반환한다고 생각하기 때문에 심각한 오류의 원인이 되기도 합니다.
프로그램의 실행이 완전히 틀린 결과를 내놓을 수 있는 소스 코드를 첨부합니다. 실제로 복잡한 프로그램을 작성하면서 헤더를 제대로 작성해 주지 않고 컴파일러의 경고 메시지를 무시하다 보면 이런 사소한 실수에서 잘못된 결과를 얻어 디버깅에 어마어마한 시간을 소비하게 되는 경험을 여러 번 하게 됩니다. 선임자가 만들던 몇 만 라인짜리 프로그램이 이렇게 작성되어 있다면 이 프로그램은 언제 터질지 모르는 폭탄이라고 생각해도 좋습니다.


<리스트 4>는 정상적으로 컴파일되고 실행도 가능합니다. 왜 그런 것일까요? 앞에서 선언되지 않는 함수에 대해서는 int를 가정한다고 설명한 바 있습니다. 따라서 이 프로그램은 경고 메시지를 출력하기는 하지만 문법적으로 전혀 하자가 없습니다. 하지만 출력되는 결과는 어떤 값이 될지 예측할 수 없을 뿐만 아니라 이 값을 직접 이용하는 루틴이 있다면 심각한 오류의 원인이 된다는 것을 다시 강조합니다.
다시 원래의 소스 코드에 함수의 선언을 추가했습니다(<리스트 5>). 이제 컴파일러의 경고 메시지가 하나 없어졌다는 것을 알 수 있을 것입니다. 앞으로도 분리한 모듈에 대해서는 꼭 이렇게 함수의 선언을 추가해야 합니다. 하지만, 만일 sub.c를 다른 프로젝트에서도 계속 사용하고 싶은데 이렇게 함수를 선언해 줘야 한다면 아주 귀찮은 일이 될 것입니다. 이런 귀찮은 역할을 대신 해주는 것이 헤더라는 사실은 이미 잘 알고 있으리라 생각합니다. 헤더를 이용해서 hello jiny 프로그램을 다시 수정해보겠습니다(<리스트 6>).
이렇게 헤더가 완성되었습니다. 하지만 함수의 선언은 그렇다고 해도 시작과 끝에 적혀 있는 #ifndef는 왜 필요한 것일까요? sub.h에 다음 한 줄을 추가하고 #ifndef 등을 삭제해 컴파일해 보면 쉽게 답을 얻을 수 있을 것입니다.










sub.h
//#ifndef __SUB_H__
//#define __SUB_H__

#include “sub.h”
void print_hello(void);
//#endif /* __SUB_H__ */
#ifndef는 같은 헤더 파일이 프로그래머가 알지 못하는 사이에 재귀적으로 포함되어 문제가 생기는 것을 방지해 주는 역할을 합니다. 필자가 매우 놀랐던 것 중 하나는 비교적 경험이 많은 프로그래머들도 헤더의 시작에 ‘recursive inclusion’을 방지하기 위한 장치를 사용하는 것을 간과하는 경우가 많다는 것입니다. 독자들은 헤더를 작성하는 경우에 이렇게 쓰는 것을 공식이라고 생각하고 잊지 않았으면 합니다.
헤더 파일은 보통 파일로 분리된 모듈에 대해서 인터페이스를 제공해주기 위해 사용합니다. 하지만 헤더는 컴파일러의 입장에서는 C 소스 코드와 전혀 다르지 않습니다. #include에는 헤더만 포함될 수 있는 것이 아니므로 #include “sub.c”와 같은 문장을 사용해도 문법적으로는 전혀 문제가 없습니다. 하지만 이렇게 사용하는 것은 적어도 필자의 관점에서는 바람직하지 않습니다.
많은 초심자들이 자주 범하는 실수 중 하나가 헤더에 함수를 정의(definition)해 사용하는 것입니다. 이러한 방식은 코드를 작성하면서 자신이 그 내용에 대해 이미 알고 있다면, 그리고 편리한 프로그래밍을 위해 일부러 이렇게 작성한 것이라면 전혀 문제가 되지 않습니다. 하지만 작성자가 이 사실을 인지하지 못한 상태라면 심각한 문제가 될 가능성이 많습니다. 좋은 헤더를 만들기 위해서는 많은 경험이 필요합니다. 헤더 파일과 소스 파일에 대해 명확한 기준을 세워 놓지 않고 프로그래밍을 하게 되면 어느 한 순간 “symbol multiply defined”나 “include nested too deeply” 같은 피곤한 에러들을 만나게 될 것입니다. 헤더가 열 개가 넘고 서로의 포함 관계가 복잡한 경우 이런 문제를 해결하려면 소스 코드를 여러 곳 수정해야 하는 경우가 많습니다.
그러면 다시 여기에서 퀴즈를 내겠습니다. 이번에는 sub.c의 print_hello()에서 static을 사용하지 않았습니다. 만일 print_hello() 함수를 static void print_hello()로 바꾼다면 이 프로그램은 작동하지 않습니다. 정확하게 말하면 컴파일을 할 수 없습니다. 좀더 정확하게 말하면 컴파일된 sub.o와 main.o를 링크해 실행 파일을 생성하지 못합니다. 왜 그런 것일까요?
Static은 두 가지의 조금 다른 의미를 지닙니다. 함수에 사용되는 경우에는 “이 함수가 적혀 있는 이 파일 이외의 파일에서는 이 함수를 사용할 수 없다”는 의미를 가지게 됩니다. 아울러 C로 작성한 대형 프로젝트에서는 보통 C를 이용해 객체지향의 개념을 도입하게 되는데, 이때 C++에서의 private을 비슷하게 구현하기 위해 사용되기도 합니다.
Static을 변수에 사용하는 경우에는 “이 변수는 이 프로그램이 끝날 때까지 다른 변수와는 다른 특별한 곳에 저장되어 함수가 끝나도 값이 변형되지 않는다”라는 의미를 가지게 됩니다. Sub.c를 static을 사용해 약간 변형시켜 보았습니다. Print_text() 함수는 main.c에서는 직접 사용할 수 없는 함수로 선언되어 있으며 동시에 print_text() 내에서 사용하는 print_cout라는 변수는 실행될 때마다 값이 변하지 않고 계속 유지되는 것을 확인할 수 있습니다. 이 프로그램의 실행 결과는 다음과 같습니다.

./a.exe
[1] hello, world
[2] hello, world
[3] hello, world

[ 'The C Programming Language'를 권하는 이유 ]
먼저 고백해두자면 필자가 C를 배운 것은 아주 오래 전의 일이고, C에 관한 책을 마지막으로 읽어 본 것은 컴파일러를 공부하면서였습니다. 그렇다보니 필자는 최근에 출간되고 있는 C에 관한 서적을 접해본 적이 없을 뿐만 아니라 어떤 내용이 담겨 나오는지도 사실은 잘 모르고 있습니다. 하지만, 그럼에도 불구하고 좋은 책이란 변하지 않는 법입니다. 처음 C를 배우던 시절 몇 권의 C 관련 서적을 접해본 기억이 있고, 그 후에도 여러 가지의 다른 컴퓨터 관련 서적을 읽고 있지만 가장 기억에 남는 책 중의 하나라면 그 중에서도 C에 한정지어서 이야기한다면 단연코 Brian Kernigan과 Dennis Ritchie의 「The C Programming Language」를 꼽아야 하겠습니다. 잘 알고 있는 독자들도 많이 있겠지요. 이 책을 이해하지 않고 C에 대해 이야기하는 것은 말도 안되는 이야기입니다. 이 책이 좋은 이유를 필자가 느낀 대로 간단히 적어보겠습니다.

① 이 책의 저자들은 바로 C를 개발한 주인공들입니다. 저자들은 유닉스를 개발한 사람들이고, C는 유닉스를 개발하기 위해 개발된 언어입니다.

② 이 책에는 간결하면서도 명확하고, C의 철학에 잘 맞는 주옥같은 코드가 많이 실려 있습니다.

③ 이 책에는 처음 접하는 개발자에게는 결코 해결하기 쉽지 않은, 그러나 해결하고 나면 많은 것을 생각하게 해주는 연습문제가 많이 실려 있습니다.

④ 짧고 간결하게 모든 것을 설명해주고 있습니다. 필자가 포인터를 여전히 어렵게 느끼고 있던 시절, 겨우 열 페이지에 불과한 이 책의 포인터 설명 부분은 모든 것을 명확하게 정리해 주었습니다. 다음 기사에서 꼭 소개하겠지만 단 한 줄의 코드가 복잡한 머릿속을 깔끔하게 정리해 주었던 그 때의 흥분을 필자는 항상 기억하고 있습니다. 하지만 이 책은 참 어렵습니다. 200페이지 남짓한 아주 짧은 책이지만 이 책의 모든 내용을 이해하기 위해서는 전산과학의 중요한 내용을 대부분 이해하고 있어야 한다 해도 과언이 아닙니다. 우스갯 소리지만 이 책을 완전히 이해하려면 전산과 4학년은 되어야 한다고 말하기도 합니다. C를 좀더 공부해 보려 한다면, 그리고 좋은 책을 찾고 있다면 이 책을 꼭 정독해 보기 바랍니다. 이해하기 어려운 내용도 있겠지만 아주 좋은 경험이 될 것입니다.


자, 그러면 이때 static int print_count에서 static을 없애면 어떻게 될까요? 답은 ‘보장할 수 없다’입니다. Print_count라는 변수가 초기화되어 있지 않기 때문입니다. static으로 선언되는 변수는 선언되는 시점에서 자동으로 0으로 초기화가 되지만 다른 변수들은 그렇지 못합니다.
또 하나 소스 코드를 파일로 분리하면서 꼭 알고 있어야 하는 것은 extern과 global의 개념입니다. 자세한 설명은 따로 하지 않으려고 합니다. 다만 독자들에게 숙제로 남겨 놓고 해답은 다음 기사의 첫 부분에 싣도록 하겠습니다.
Static을 사용하지 않고 전역 변수를 이용해 프린트 함수를 호출한 횟수를 기억하기 위해서는 어떻게 하면 될까요? 그리고 main.c에서도 이 횟수를 알기 위해서는 sub.h에 어떤 내용이 추가되어야 할까요?
이 문제를 스스로 해결할 수 있다면 그 시점에서 static, extern, global에 대해 다시 한번 깊게 생각해 보기 바랍니다. Variable의 scope와 linkage라는 단어로 이 내용을 기술하게 되는데 프로그래밍 경험이 많아도 정확한 개념을 알지 못하고 대강 넘어가는 경우가 많기 때문입니다. 또 초심자들에게 가장 어렵게 느껴지는 개념 중 하나이기도 합니다.
이제 마지막으로 Makefile을 만들어 보겠습니다. Makefile을 이용하면 여러 개의 파일로 구성되어 있는 프로젝트를 손쉽게 관리할 수 있습니다.
BIN = hellojiny
OBJS = main.o sub.o

all: $(OBJS)
gcc -o ${BIN} ${OBJS}


clean:
rm ${OBJS}

.c.o:
gcc -c $<
Makefile은 개념과 작성하는 방법만으로도 소책자가 될 정도이므로 간단히라도 설명하기 위해서는 꽤 많은 지면을 필요로 합니다. 다만 makefile을 쓰면 몇 가지 편리한 점이 있습니다. 가장 좋은 점은 make라고 네 글자만 타이핑하면 된다는 것이고, 모든 작업을 target을 정해 기술해 둘 수 있으므로 rm과 같은 민감한 작업을 하는 경우 실수를 줄일 수 있습니다. 더 좋은 점은 아직 컴파일이 되지 않았거나 소스 코드가 변경된 파일에 대해 선택적으로 알아서 해당되는 작업을 수행해주기 때문에 전체 소스 코드를 컴파일하는 시간도 훨씬 짧아집니다. 또한 파일의 변경에 대해 의존성을 기술할 수 있기 때문에 sub.h가 변경된 경우 자동으로 sub.c를(sub.o가 존재하더라도) 새로 컴파일할 수 있습니다.
makefile은 단순히 소스를 컴파일하기 위해 사용할 수 있는 것만은 아닙니다. Makefile의 문법을 보며 눈치가 빠른 독자들은 느낄 수 있으리라 생각하지만 의존성을 가지고 하나의 파일을 다른 파일로 변경해야 하는 대부분의 작업에 makefile을 사용할 수 있습니다. 아주 좋은 예로는 latex 파일을 dvi로 컴파일하거나 오픈소스 프로젝트에서 문서를 생성하기 위해 makefile에 의존한다는 사실을 들 수 있겠지요.
좀 더 오픈소스 프로젝트에 가까운 방법은 GNU autoconf/ automake를 이용하는 것입니다. 많은 오픈소스 프로그램은 ./configure; make; make install만으로 컴파일과 설치를 마칠 수 있습니다. 이것을 가능하게 해주는 것이 autoconf와 automake이며 간단하게는 makefile을 간단한(?) 설정만으로 자동으로 생성할 수 있도록 해주는 프로그램입니다. 이 패키지의 사용에 대해서는 여기서는 생략할 수밖에 없지만 오픈소스와 GNU에 관심이 있는 독자라면 꼭 한번 관심을 가지고 배워보면 좋습니다. 물론 오픈소스 개발툴인 anjuta, kdevelop 등의 IDE 환경에서는 자동으로 automake, autoconf에 필요한 파일들을 생성해 줍니다.

자신감은 첫 프로그램으로부터!
이제 막 C 언어를 배웠지만 더 고급 프로그래밍을 하고 싶은 독자를 위해 첫 기사를 마쳤습니다. 필자는 어린 시절 터보 C라는 좋은 프로그램으로 처음 C를 배웠습니다. 무작정 책을 사 놓고 페이지를 뒤적이고 나서 문법은 이해가 되었다고 생각했던 바로 그 때쯤의 당혹스러움을 아직도 잊지 못하고 있다. 이곳저곳에서 몇 가지 언어로 여러 프로그램을 때로는 일로 때로는 재미삼아 만들고 있는 지금까지도 어느 순간 프로그래밍에 대해 두려움이 없어졌는지 잘 기억해 낼 수가 없嗤?확실한 것은 첫번째 프로그램 하나가 엄청난 자신감을 안겨준다는 사실입니다. 스스로 동기를 부여해 쓸모없어 보이는 간단한 프로그램이라도 많은 것을 만들어 보기를 권하고 싶습니다.
가능하면 C에 관한 내용보다는 C를 이용해 프로그래밍하면서 만나는 여러 가지 문제나 일부러 신경을 쓰지 않으면 간과하기 쉬운 문제들에 대해 다루려고 생각합니다. 특히 어느 정도 막막한 느낌을 떨쳐내고 나면 고민하게 되는 코딩 스타일의 문제나 버그를 적게 만들어 낼 수 있는 코드의 작성 등에 관해서도 다뤄보려 합니다.
다음 호에서는 C에서 가장 어려운 부분이라고 누구나 느끼게 되는 포인터에 대해 다루고자 합니다. 기본적인 포인터의 개념보다는 구조체의 포인터, 함수 포인터, 함수 포인터를 이용한 플러그인의 구현 방법 등에 대해 다룰 것입니다. 기사의 내용에 관한 궁금한 점이 있으면 언제든지 마소 사이트(www.imaso.co.kr)를 이용해 질문해 주기 바랍니다.

[ 프로그래밍,그 막막함을 없애자]
제대로 된 첫 프로그램을 만들어 보는 것은 굉장히 어려운 일입니다. 특히 프로그램을 만들어 본 경험이 없는데, 이제 막 첫 언어를 배운 후라면 그 답답함이란 이루 말할 수 없습니다. 혹시라도 도움이 될 지도 모를 이야기 몇 가지를 두서없이 풀어보려고 합니다.
프로그래밍이란 무엇일까요? 어렵고 거창할 필요는 없습니다. 사람이 하는 말을 기계가 알아듣게 번역해 주는 일에 불과합니다. 컴퓨터가 사람이 하는 말을 배우는 것은 아직 어려운 일이니 사람이 컴퓨터가 할 줄 아는 말을 배워서 일하는 법을 가르쳐 주는 것이지요. 한국어는 너무 익숙하니 영어를 처음 배우던 시절을 한 번 생각해 보면 어떨까요? 관사, 정관사에 부정사 따위의 문법은 어느 정도 알고 있다고 생각하지만 영어로 말을 하려면 막막하기만 한 느낌, 바로 그 느낌이 프로그래밍을 시작하지 못하고 있는 독자의 느낌과 같은 것입니다.

‘자료의 구조’ 표현에 익숙해지기
아주 간단한 프로그램을 제외하면 대부분의 프로그램은 자료구조로 이뤄집니다. 여기에서 트리, 리스트 같은 자료구조를 떠올리면 아직은 조금 성급한 판단입니다. 필자가 이야기하고 싶은 것은 단어 그대로 순수한 ‘자료의 구조’입니다. 트리나 리스트, 그래프와 같은 자료구조는 컴퓨터에게 알려주어야 할 자료의 구조를 컴퓨터에게 알려주는 가장 기본적인 방법입니다. 자료구조에 대해 배운다는 것은 사람이 생각하는 방식을 컴퓨터로 생각하는 방식으로 바꾸는 기초적인 방법을 배운다는 것과 비슷한 이야기가 됩니다. 프로그래밍은 이 자료의 구조를 표현하는 방식과 표현한 여러 가지의 구조를 조합하여 원하는 일을 하는 방법을 적는 방법에만 익숙해지면 생각보다 그렇게 어려운 일은 아닙니다.

결정해야 할 의문들에 스스로 답하기
프로그래밍이 어렵게 느껴지는 이유 중의 또 하나는 아무리 간단해 보이는 것이라도 결정해야 할 것이 매우 많은데, 자신이 만든 프로그램이 작동하는 것을 본 경험이 적은 프로그래머의 경우에는 너무 깊게(또는 너무 단순하게) 이 문제를 생각하기 때문입니다.
간단한 주소록 관리 프로그램을 예로 들어보겠습니다. 주소록의 용도는 아주 단순합니다. 친구들의 이름과 전화번호를 기록해 찾을 수만 있다면 이미 주소록은 제 역할을 다 하게 되는 것이지요. 이름과 전화번호만을 기록하고 찾을 수 있는 주소록을 만들고 싶다면 어떻게 하면 좋을까요? 먼저 이름과 전화번호는 어떻게 표현하면 좋을까요? 이름은 char name[10]이 될 수도 있고, 전화번호는 char phone[10]이 될 수도 있습니다.
하지만 성과 이름을 분리하려고 한다면 이름을 표현하기 위해 char firstname[10]과 char lastname[10]이 필요할 수도 있습니다. 전화번호의 국가번호와 지역번호, 국번을 표현하기 위해 각기 다른 변수를 사용할 수도 있습니다. 이름과 전화번호를 연결해 저장하기 위해서는 어떻게 표현하는 것이 좋을까요? 저장할 수 있는 인원의 수에 한계를 두지 않으려면 어떤 방법으로 만드는 것이 좋을까요? 저장은 파일에 직접 하는 것이 좋을까요? 데이터베이스를 사용하는 것이 좋을까요? 파일에 저장한다면 어떤 방법으로 파일에 저장하는 것이 좋을까요? 이 방법은 저장하기와 읽어오기의 효율이 얼마나 좋을까요? 저장한 정보에서 이름으로 전화번호를 검색하려면 어떤 방법을 사용하면 좋을까요? 이 검색을 더 빠르게 하고 싶다면 저장하는 구조를 어떻게 바꾸는 것이 좋을까요? 내가 사용하는 검색방법은 얼마나 메모리를 사용할까요? 메모리가 아주 작은 컴퓨터에서도 작동하게 하기 위해서 메모리 사용량을 줄이려면 어떻게 하면 좋을까요? 프로그래머는 이런 많은 의문에 스스로 확신할만한 답을 얻어내야 합니다. 그리고 그 과정에서 컴퓨터의 사고방식을 조금 더 잘 이해할 수 있게 되고, 이 과정에 대해 답을 얻기 위해서 많은 것을 스스로 공부하게 됩니다.
처음 프로그램을 시작하려고 할 때 가장 좋은 예로 들게 되는 것은 바로 앞에서 이야기한 주소록이 됩니다. 자료구조의 표현과 검색, 정렬 등 프로그래밍에서 자주 사용하는 대부분의 방법들이 포함되기 때문이지요. 아직 주소록을 C로 직접 구현해 본 경험이 없는 독자라면 꼭 한번 시도해 볼 것을 권합니다.


Posted by theYoungman