본문 바로가기
AI 학교, AI 환경

블로그를 데이터 베이스로 만들기

by 격암(강국진) 2025. 6. 7.

저는 티스토리의 블로그를 17.7년간 해오고 있습니다. 본래는 다음의 블로그였는데 다음블로그가 이사오면서 티스토리 블로그가 되었죠. 한번은 블로그가 멈춘 기간이 있어서 그 이후에는 네이버 블로그에 백업블로그를 운영해 오고 있기도 합니다. 그런데 그러다 보니 글이 3천개가 넘어 갑니다. 방문해 주시는 분들도 그렇지만 저도 제가 무슨 글을 썼는지 알기 힘듭니다. 

 

최근에 클로드의 데스크탑 버전에 mcp 서버들을 설치하면서 AI와 함께 뭘 할 수 있는가를 실험해 보고 있습니다. 그래서 저는 제 블로그의 글들을 데이터 베이스로 만들고 그걸 분석하거나 제가 잘 쓸 수 있도록 하는 일을 시작해 보았습니다. AI와 상담해 본 결과 티스토리 백업 기능을 이용해서 글들을 일단 백업받았습니다. 그 결과물은 1.17기가의 파일들이었는데 html로 하나 하나의 글을 저장한 것이었습니다. 그런데 이렇게 해서는 어떤 글이 어디에 있는 지 알기 어렵죠. AI의 추천은 이 데이터를 SQlite라는 형태의 데이터 베이스로 전환하라는 것이었습니다. 그러면 데이터를 읽고 분석하는 일이 빠르다는 것였죠. 

 

그래서 AI에게 그걸 해달라고 했습니다. 저는 파이선 코드 실행 MCP를 설치해 두었기 때문에 AI가 코드를 짜고 그걸 실행해서 티스토리 데이터 를 SQlite 데이터베이스로 변환했습니다. 변환한 결과는 160메가의 tistory_blog.db라는 하나의 파일이었습니다. 이 하나의 파일에 모든 글들과 정보가 들어 있는 것이죠. 

 

그리고 나서 AI는 이 데이터 베이스를 분석할 파이선 코드를 짜 주었습니다. 실행하면 GUI로 여러가지 정보를 주는 프로그램이더군요. 이 데이터 베이스를 잘 들여다 보기 위해 이 프로그램은 앞으로 개선되어야 하겠지만 여러가지 통계를 보여주는 프로그램이었습니다. 예를 들어 저는 2010년 2월에 가장 많은 글들을 썼더군요. 제가 키워드를 주면 그 키워드에 맞는 글의 목록을 보여주는 기능도 있었습니다. 

 

 

자신의 글이라고 해도 물론 저처럼 긴 세월동안 글을 쓴 사람은 그게 다 뭐였는지 기억할 수 없습니다. 가장 사람들이 많이 본 글이 뭐였는지 언제 글을 많이 썼고 얼마나 많이 썼는지. 그래서 일기나 블로그도 이렇게 데이터 베이스로 만들어서 분석하고 보다 쉽게 그 내용을 보게 만드는 것이 바람직한 것같습니다. 아직은 기본적 분석만 본 셈입니다만 이 데이터 베이스로 저는 자기로의 여행을 떠날 수 있을 것같습니다. 아마 다른 블로거 님들도 이렇게 해보는 것이 바람직할 것입니다. 

 

오늘은 이런 작업을 하는 도중에 경험담으로 소개삼아 이것을 올립니다. 이런 데이터 베이스를 만들고 프로그램을 짜는 것은 본래 개발자들이하는 것이지만 AI를 쓰면 아주 쉽게 됩니다. 어쩌면 이 데이터 베이스를 주고 AI에게 책을 한권 구상해 보라고 하면 책을 만들어 줄지도 모르죠. 상상하기에 따라 해볼 수 있는 것은 더 많이 있을 거라고 생각합니다.

 

블로그를 방문해 주신 여러분. 이것이 지난 17.7년간의 정보입니다. 그간 방문해 주셔서 감사합니다. (이건 티스토리 블로그 https://irepublic.tistory.com/의 분석입니다. 네이버 블로그는 완벽한 카피 블로그가 아니라서 약간 글이 작습니다. )

🎯 티스토리 블로그 종합 분석 리포트
======================================================================

📊 기본 통계
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📝 총 포스트 수: 3,752개
📅 블로그 기간: 2007-09-26 ~ 2025-06-06
📊 블로그 운영 기간: 17.7년 (6,463일)
📈 연평균 포스팅: 212.0개
📊 평균 글 길이: 961.5 단어
📚 총 단어 수: 3,602,676 단어
📖 글 길이 중앙값: 877 단어
📄 가장 긴 글: 25,160 단어
📝 가장 짧은 글: 1 단어

📈 연도별 활동
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🏆 가장 활발했던 해: 2010년 (374개 포스트)
📝 그 해 평균 글 길이: 803.3 단어

📊 연도별 포스트 수:
2016: █████████████ 166개
2017: ████████████████ 204개
2018: ███████████████████ 240개
2019: ███████████████ 199개
2020: █████████████ 165개
2021: ███████████ 143개
2022: ████████████ 156개
2023: ████████████ 150개
2024: ████████████ 150개
2025: █████████ 119개

🏷️ 카테고리 분석
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📂 총 카테고리 수: 91개

🥇 상위 10개 카테고리:
 1. 주제별 글모음/세상보기                   581개 (평균 949단어)
 2. 임시보관함                          563개 (평균 436단어)
 3. 주제별 글모음/생활에 대하여                254개 (평균 973단어)
 4. 연작 에세이들/기타 잡글                  155개 (평균 553단어)
 5. 독서와 글쓰기/책 이야기                  104개 (평균 1301단어)
 6. 주제별 글모음/인공지능에 대한 글              92개 (평균 1200단어)
 7. 음식 인테리어 쇼핑/아이패드, IT,자동차         88개 (평균 814단어)
 8. 주제별 글모음/과학자의 시선                 86개 (평균 1148단어)
 9. 주제별 글모음/국가란 무엇인가                86개 (평균 1162단어)
10. 여행/전주 생활                        81개 (평균 656단어)

댓글