재수강중인 파이썬... 안까먹게 파이썬의 기초 정리
구글 colab에서 python환경을 만들어서 코드를 작성해보고있다.
만든 colab파일은 구글 드라이브에 저장되는데, 작업한 데이터 파일은 꼭!! 따로 다운로드 받아야 한다.
!zip -r /content/'파일명입력'.zip /content/news
만든 데이터를 zip파일로 만들어 다운 받는 방법
/content/news는 파일들의 경로, 만들어진 압축파일 '파일명입력'.zip을 저장하면 된다.
라이브러리를 불러온 후에 작업할 수 있다.
주로 pip install ____ requests 로 나오는 듯한데, lib제작자가 올려주니 외울 필요x
스크래핑, 크롤링
웹, 데이터 등에서 자료를 스크랩하고 보기 좋게 가공하는 과정.
웹 :
url을 입력하고, 필요한 자료의 형식을 설정(텍스트라던지 url이라던지.. 필요한 데이터 부분),
어떤 경로에 들어있는지 콘솔을 통해 확인하고 경로를 가져와 lis(lists)함수로 정의,
lis = soup.select('#main_pack > section > div > div.group_news > ul > li')
어떤 방식으로 출력할지 select, select_one을 활용하고 print(a.text) 등으로 정의하면 짠 하고 데이터가 나온다.
스프레드시트(엑셀 등) :
어떤 시트를 가져와 작업할 것인지 넣고, 시트의 어떤 부분을 활용할 것인지,
시트 내용에서 가져온 것을 어떤 방식으로 출력할지 적기.
if, for 문을 활용하여 특정 값만 출력할 수도 있다.
row는 ↓(y축), →(x축)은 0부터 시작한다는걸 기억하자:)..
+ 정보. 익숙해지자
a 는 <a> 태그, 외부 문서나 내부 문서 링크시 사용하는 태그
href 는 hypertext reference, 실제 이동할 웹페이지 주소를 적는 속성
<a> 태그와 href 속성은 서로 같이 쓰여야 링크를 만들 수 있다
왜인지 모르겠는데,,
Mac에서 킨 colab환경에서는 xlsx파일이 작동하지 않는다.. 그래서 엑셀은 잘 출력이 되었는지 확인불가;
빨리 해결해야지...ㅜ.ㅜ
'AI 웹개발반' 카테고리의 다른 글
[TIL+] To being 좋은 개발자,,, (0) | 2023.03.20 |
---|---|
[TIL] 파이썬 기초2 _문제풀이 (1) | 2023.03.20 |
[WIL]:01 좌충우돌 개발 1주차.. (0) | 2023.03.17 |
[TIL] python 재수강 중, img 경로설정문제? (0) | 2023.03.17 |
[TIL] 오늘도 css / python 맛보기 (0) | 2023.03.16 |