html与html5 总结

    <input type=”url”
name=”user_url” id=””>       //url格式输入    如图:

一、说明

1.靶网址:拉勾网

2.贯彻内容:爬取相应的字段

图片 1

多少表名  图片 2

图片 3

3.思路

1.第一类似于 https://www.lagou.com/jobs/**2182417**.html
这样的链接是最终使之url。基本还是大抵,要换的尽管是那无异拧数字,编写正则表达式匹配就吓。

2.除首页还来其他地方吗会找到这么的url,所以我先行匹配岗位分类的url
例如:https://www.lagou.com/zhaopin/Java/,在抓取最终之url。

3.scrapy会自动去重。

4.数据

图片 4

      <li>…</li>
    </ol>
    <div></div>
//容器标签
    <table>定义表格
    <thead>表头
    <tbody>表格主体

二、运行

1.布置好不无关系数据库的信息,运行main.py函数即可

                                         
                               
 图片 5

有关代码已经修改调试成功—-2017-4-24

    图片 6

端详代码请动我的github:https://github.com/pujinxiao/Lagou_spider

        <th>小标题</th>

其三、问题—-欢迎留言提出问题

声称:此项目要是上CrawlSpider类,爬取全站的职信息,熟悉Rule的有的用法。

1.您晤面发现爬取一小会儿,会叫受掉IP,要选购代理IP才可行,免费之代理IP都不好用了,还有即使是放慢抓取的进度。这样效果会再也好。(解决)

接有趣味的伴侣帮自己优化,解决上述问题,之后我用联合而的代码,作为贡献者,共同成长。

编者邮箱:jinxiao_pu@163.com


如果按照档对您发出因此要为本人一样发star,万分谢谢。

端详代码请走我的github:https://github.com/pujinxiao/Lagou_spider

作者:今孝 

出处:http://www.cnblogs.com/jinxiao-pu/p/6757145.html

正文版权归作者和博客园共有,欢迎转载,但未经作者同意要保留这个段子声明,且以文章页面明显位置被起原文连接。

      <option label=”4″
value=”欧朋”></option>

*立篇html小结
大致就是描写到此处了,没基础之同室要需要看开或看视频详细的写照一下并跃跃欲试着coding,这首小毕主要还是用于回顾一下仿照了之学识,加深影响. 

                                     
             图片 7

 

    </datalist>

    请输入:<input type=”text”
list=”list1″>

        <td>内容</td>
      </tr>
      <tr>

  </form>

    <input type=”email”
name=”user_name” id=””>       //会检测用户是否输入email格式 
如图:

      <li>信息</li>

        <th>小标题</th>
      </tr>
    </thead>
    <tbody>
      <tr>

    /*和之类似的还有 month week
time 这里我就是不一一举例了*/

        <td>内容</td>

 <datalist>元素   
与<input>元素被的list属性 配套下,例子:

        <td>内容</td>
      </tr>
      <tr>

      <option label=”1″
value=”IE”></option>

    <input type=”tel”
name=”user_tel” >        //电话号码的输入
(除了语义,与常见input比看不闹有啊界别)

<canvas>这里的文字会在浏览器不支持canvas的下显得</canvas> 
 //默认画布是width:300,height:150

    <tfoot>表格页脚(脚注或表注)
    <tr>表格行
    <th>表头
    <td>表格单元格
    <caption>表格标题

    <input type=”number”
name=”user_number” value=”1″ max=”100″ min=”1″ step=”10″>     
 //数字格式输入  max最酷值  min最小值  step按同次加多少

                    图片 8

                           
  图片 9

7.canvas画布

multiple         
//提交多卖文件或者图片

        <th>小标题</th>

    <input type=”search”
name=”user_search” >   //搜索  与一般Input相比多了一个x

    <col>为表定义属性值

      <option label=”5″
value=”苹果”></option>

 

        <td>内容</td>

    <colgroup>对表的排进行整合
    <table> //表格标签 
 

  6.HTML5初增表单属性

    <datalist id=”list1″>

        <td>内容</td>

                                         
     图片 10

    <blockquote></blockquote>//长文本引用
    <br/> //换行标签
    <hr/> //分割线标签
    $nbsp;
//特殊字符空格(分号必不可少)

      <option label=”3″
value=”谷歌”></option>

                         
图片 11

  <form action=”#”
method=”get”>

 

        <td>内容</td>

      <option label=”2″
value=”火狐”></option>

                                         
                   
  图片 12

        <td>内容</td>

    <input type=”date”
name=”user_date” >         //日期  如图:

    <input type=”color”
name=”user_color” >    //颜色   (很强大)

时间:于2017年12月3日 19:35:18开始

                                         
                   
 图片 13    

              <input type=”range”
name=”user_range” value=”1″ max=”100″ min=”1″ step=”10″>   //滑动块 
  与number相识  只是显示的效果不同

required=”required”         
 //不可知为空

autofocus=”on”
//默认获得焦点(加载页面后该属性所当的要素默认获得焦点)

用于:
这篇用于个人技术总结(全文转发呼吁标明出处,小段摘抄随意)

    <input type=”file”
name=”user_file” >    //提交文件
    <input type=”img”
name=”user_img” >    //提交图片

  </form>

HTML笔记
1、html标签不区分轻重缓急写,但是建议小写
2、常用标签:
可用在head部分:
  <head>
    <title>…</title>
//网页标题
    <meta charset=”UTF-8″>
//提供有关页面信息
    <link rel=”stylesheet”
type=”text/css” href=”theme.css”> //链接一个表面样式表
    <style>…</style>
//内部样式表
    <script>…</script>
//内部js代码
  </head>
  <body>
    <p>段落文本</P>
//文章段落放到<p>标签里
    <h1>…<h6>
//文章的标题,一到六只级次的题
    <b></b>
//无意义的加粗,仅文本表现加粗(没有语义)
    <strong></strong>
//有意义的加粗,对找引擎友好
    <i></i>
//无意义的斜体(没有语义)
    <em></em>
//有意义的斜体,对寻找引擎友好
    <span></span>
//用来做文档中之行内元素(没有语义)
    <q></q>
//短文本引用(文本不欲加双引号)

   <form action=”#”
method=”get”>      //表单元素 
action属性指这表单要用哪个后台文件执行 
 method属性指要用“get”或者“post”方法传表单

    <input type=”submit”
value=”提交”>              //必不可少的付表单  <button
type=”email”>提交<button> 相同功能

    <address>地址</address>
//地址标签,默认是斜体
    <code>代码</code>
//单行代码标签
    <pre>代码</pre>
//多行代码标签(会保留空格和换行符)
    <ul>
//无序列表(list-style:none;样式去前面的点)

      <li>信息</li>
    </ul>
    <ol> //有序列表

5.HTML5新增表单元素

        <td>内容</td>
      </tr>
    </tbody>
    </table>
    <a
href=”网址”>链接显示的文本</a> //超链接标签
    <img src=”图片地址”
alt=”图片未显得时的轮换文本” title=”提示文本”/> //插入图片
    <form method=”get/post”
action=”服务器文件(save.php)”></form> //表单标签
    <input type=”test/password”
name=”名称” value=”值”/> //输入框
    <textarea rows=”行数”
cols=”列数”>文本</textarea> //在表单中大段文字用
    <input type=”radio/checkbox”
value=”值” name=”名称” checked=”checked”/>
    /*单选框radio与复选框checkbox
checked=”checked”为默认选中*/

    <option
value=”提交值”>选项</option> //下拉框
    <form action=”save.php”
method=”post”>
    <label
for=”a”>爱好</label>
//为input元素定义标注(for与input的id绑定,点击label也足以触发发控件)
    <select id=”a”>
//下拉框例子
    <option
value=”看书”>看书</option>
    <option value=”旅游”
selected=”selecred”>旅游</option>
    <option
value=”运动”>运动</option>
    <option
value=”购物”>购物</option>
    </select>
    </form>
    <input type=”submit”
value=”提交”/> //表单提交按钮
    <input type=”reset”
value=”重置”/> //表单重置按钮
  </body>
3.语义化的意向:更易于给寻找引擎收录.
4.html的注释:<!–这是html的注释–>

      <li>…</li>

鉴于canvas需要采用js  这里就未详细说明了 
到上在js总结里说  或者另行又写一个专程讲canvas的

    <caption>大标题</caption>
    <thead>
      <tr>

    <button
type=”submit”>提交</button>

pattern=”” //自定义正则表达式
placeholder=”文本框提示信息”
//文本框提示信息

        <td>内容</td>

                           
  图片 14

 

autocomplete=”on”||autocomplete=”off”
//自动完成功能 例子:
  <form action=”#” method=”get”>
    用户名: <input type=”text” name=”username”
autocomplete=”on”/> <br/>
    密码: <input type=”text” name=”password”
autocomplete=”off”/> <br/>
  </form>