LLM – 새로운모델 GPTx를 만들어보라고 시켜봤더니..

LLM에 대해 대략적(겉핥기~)으로 살펴보고 약간은 이해를 하기도 했으니.. 새로운 모델을 하나 만들어볼 수 있을까 싶어 gpt에게 시켜봤습니다. 실제로 동작하지는 않겠지만 대략저긴 코드 이해하는데 역시 큰 도움이 되었습니다. 트랜스포머 모델은 수학적 개념이지만, 이걸 학습하고 실행하는건 코드로 되어 있을거고, 이 코드를 쉽게 만들 수 있도록 pytorch나 tensorflow와 같은 프레임워크가 존재하는거지?자 그럼 신규 트랜스포머 모델을 활용한 GPTx 라는 … Read more

LLM – GPT는 수학적 계산을 어떻게 할까? (2)

이어서 다음도 궁금해집니다. gpt 는 어떻게 파이선코드를 실행할지 말지 판단할까라고요… gpt는 트랜스포머모델을 사용해 사람의 질문을 문장으로 이해하잖아? 그런데 문장을이해하고 문장으로 결과값을 생성해내는데, 중간에 파이썬코드로 처리해야겠다는 판단을 트랜스포머 모델이 하진 않잖아? 그럼 누가 판단하는거지? 정확한 질문이야! 트랜스포머 기반의 GPT 모델은 문장을 이해하고 문장으로 답변을 생성하지만, Python 코드 실행이 필요하다고 판단하는 역할은 트랜스포머 모델이 직접 하는 것이 … Read more