본문 바로가기
AI 웹개발반

[TIL] 파이썬 기초1

by 째깍단 2023. 3. 18.

재수강중인 파이썬... 안까먹게 파이썬의 기초 정리

 

 

구글 colab에서 python환경을 만들어서 코드를 작성해보고있다.

만든 colab파일은 구글 드라이브에 저장되는데, 작업한 데이터 파일은 꼭!! 따로 다운로드 받아야 한다.

 

!zip -r /content/'파일명입력'.zip /content/news

만든 데이터를 zip파일로 만들어 다운 받는 방법

/content/news는 파일들의 경로, 만들어진 압축파일 '파일명입력'.zip을 저장하면 된다.

 

 

라이브러리를 불러온 후에 작업할 수 있다.

주로 pip install ____ requests 로 나오는 듯한데, lib제작자가 올려주니 외울 필요x

 

 

스크래핑, 크롤링

웹, 데이터 등에서 자료를 스크랩하고 보기 좋게 가공하는 과정.

 

웹 :

url을 입력하고, 필요한 자료의 형식을 설정(텍스트라던지 url이라던지.. 필요한 데이터 부분),

어떤 경로에 들어있는지 콘솔을 통해 확인하고 경로를 가져와 lis(lists)함수로 정의,

lis = soup.select('#main_pack > section > div > div.group_news > ul > li')

어떤 방식으로 출력할지 select, select_one을 활용하고 print(a.text) 등으로 정의하면 짠 하고 데이터가 나온다.

 

스프레드시트(엑셀 등) : 

어떤 시트를 가져와 작업할 것인지 넣고, 시트의 어떤 부분을 활용할 것인지,

시트 내용에서 가져온 것을 어떤 방식으로 출력할지 적기.

if, for 문을 활용하여 특정 값만 출력할 수도 있다.

 

row는 ↓(y축), →(x축)은 0부터 시작한다는걸 기억하자:)..

 

 

+  정보. 익숙해지자

a 는 <a> 태그, 외부 문서나 내부 문서 링크시 사용하는 태그

href 는 hypertext reference, 실제 이동할 웹페이지 주소를 적는 속성

<a> 태그와 href 속성은 서로 같이 쓰여야 링크를 만들 수 있다

 

 

 

왜인지 모르겠는데,,

Mac에서 킨 colab환경에서는 xlsx파일이 작동하지 않는다.. 그래서 엑셀은 잘 출력이 되었는지 확인불가;

빨리 해결해야지...ㅜ.ㅜ