νλ κ²½μ μ°κ΅¬μ λΆμ μ€ 2
β νλκ²½μ μ°κ΅¬μ λΆμ μ€ 2
> λ€μ΄κ°λ λ§
1. ν€μλ μΆμΆμ΄λ λ³΄κ³ μ νμ΅μ μν€κΈ° μν΄μλ μ²μ λͺ©νλ‘ νλ λ¬ΈμλΏ μλλΌ λ€λ₯Έ μΉ΄ν κ³ λ¦¬μ λ¬Έμλ€λ λ§μ΄ νμνλ€.
2. κ·Έλμ μ§λ λ² μνκ² λ€κ³ νλ λΆμΌλ³ ν¬λ‘€λ§μ νκΈ°λ‘ νλ€.
3. λΆμΌλ,
{ κ²½μ : μ½ 7,200κ°, μ°μ κ²½μ : μ½ 6,500κ°, μ¬νλ¬Έν : μ½ 6,300κ°, ν΅μΌ : μ½ 6,500κ° }
λ³΄κ³ μ μ 체 κ°μλ μ½ 2λ§5μ²κ° μ λκ° λ κ² κ°λ€.
4. νλκ²½μ μ°κ΅¬μμ΄ νμ°¨λ νμ€ κ³μ΄μ΄ μλκ³ (μ§λΆκ΄κ³λ μλ€λ§) κ³ μ μ£Όμ ν μλ²μ§ κ³μ΄μ΄λΌ νλμμ°μ ν΅ν΄ λλΆμ¬μ μ μ§ννκ³ μμ΄ (νμ¬λ μ’ νλ λ―ν΄λ) λ€λ₯Έ κ²½μ μ°κ΅¬μμμλ μ³λ€λ λ³΄μ§ μλ ν΅μΌμ λν λ³΄κ³ μκ° μ 리 λ§λ€. νλ₯νλ€.
5. μ΄μ°¨νΌ μ΄κ² λ΄ μ 곡λ μλκ³ μ¬λ―Έλ‘ 곡λΆνλ©΄μ ν΄λ³΄λ κ²μ΄λ νλ² λκΉμ§ νλ³΄λ €κ³ νλ€.
6. λ³΄κ³ μ 2λ§5μ²κ°λΌλ©΄ νλλΉ μ΅μ 3μ΄λ§ μ‘μλ μμ μκ°λ§ μ¬μ§μκ³ μ½ 21μκ°μ΄ κ±Έλ¦°λ€.
7. κ·Έλμ μΌλ¨ κ±Έμ΄λκΈ° μν΄ μμ μ λΉ λ₯΄κ² μμνλ€.
> κ²½μ ννΈ post μ 보
1. κ²½μ κ²μν νμ΄μ§ μ 보
- secondDepth κ° 1μ΄λΌλ κ²μ΄ μ΅μ λ³΄κ³ μ κ²μνκ³Ό λ€λ₯΄λ€.
page_url = "http://hri.co.kr/board/reportList.asp"
numIdx:
skin:
mode:
GotoPage: 2
column:
keyword:
firstDepth:1
secondDepth:1
thirdDepth:
fourthDepth:
boardid: 1,2,8,38,125,126,127,128,129,5,132
sortby:
2. κ²½μ μμΈ νμ΄μ§ μ 보
- λ§μ°¬κ°μ§λ‘ urlμ£Όμμ secondDepthλ§ λ€λ₯΄λ€.
page_url = "http://hri.co.kr/board/reportView.asp"
numIdx: 25726
skin:
mode:
GotoPage: 4
column:
keyword:
firstDepth:1
secondDepth:1
thirdDepth:
fourthDepth:
boardid:1,2,8,38,125,126,127,128,129,5,132
sortby:
3. μ κ·ννμ μμ
GotoPage = re.findall('\'/board/reportView.asp\',\'1\',\'1\',\'\',\'\',\'\',\'(.*?)\'',html)
- μ΄ μΈ λλ¨Έμ§λ λͺ¨λ λμΌνλ€. μλ£μμ§ μμ.
> μ€ν
1. 1506λ²μ κΈ°μ μΌλ‘ pdf μ£Όμκ° λ°λμλ€ γ ‘,γ ‘ μ΄ λΆλΆμμ μ κ·ννμ μμ ν΄μ λ€μ μ€ν. γ
- 1553λ²μ λ μ μμ μΌλ‘ λ€μ΄μλ€. μ΄κ²λ§ μμΈμ²λ¦¬.
2. 1552λ²λΆν° νμΌλͺ μ νκΈμ΄ λ€μ΄κ°κΈ° μμνλ€. λ μλ¬.
- urllib.parse.quote_plus(reportID) λ₯Ό μ΄μ©ν΄ reportIDλ₯Ό μΈμ½λ©ν΄ λ겨μ€λ€. μ΄κ²λ μ§μ§ νμ°Έ μ°Ύμλ€.
3. νμ¬ κ²½μ ννΈ λ³΄κ³ μ ν¬λ‘€λ§ λͺ¨λ μλ£. μ΄ 4300κ°λ€.
κ²μν λ²νΈμ λ§μ΄ λ€λ₯Έλ° μ²μ νμ΄μ§ ν¬λ‘€λ§ν λ μ€λ³΅λ κ²λ€μ μ κ±°νκ³ κ°μ Έμ€κΈ° λλ¬Έμ΄λ€. (μ΄λ° κ²λ€μ΄ λ§€μ° λ§λλΌ)
4. μ΄μ 1/4 λλλ€.