stata中文教程-入门经典资料下载.pdf

资源描述

stata中文教程-入门经典资料下载.pdf

《stata中文教程-入门经典资料下载.pdf》由会员分享，可在线阅读，更多相关《stata中文教程-入门经典资料下载.pdf（77页珍藏版）》请在冰点文库上搜索。

stata中文教程-入门经典资料下载.pdf

{i:

0;s:

17190:

"第29卷第1期2015年2月保险职业学院学报（双月刊）JOUNALOFINSUANCEPOFESSIONALCOLLEGE（Bimonthly）Vol.29No.1Feb2015论大数据对中国保险业的影响尹会岩（中国人民财产保险股份有限公司沈阳监察稽核中心，辽宁沈阳110031）摘要随着互联网金融的破冰，金融行业认识到互联网的聚众效应，随着大数据时代的来临，保险行业又该做些什么呢?

@#@大数据影响着保险行业的营销、管理、研发工，保险行业在大数据时代的影响下，采取了各种路径来尝试通过大数据及相关技术来促进业务发展，最终实现保险服务社会的目标。

@#@文中列举出保险行业中部分经营主体对广告营销、产品开发、承保定价、保险理赔、客户服务的创新，对于保险行业正确对待大数据有一定的借鉴作用。

@#@关键词保险;@#@大数据;@#@数据挖掘;@#@互联网中图分类号F840文献标识码A文章编号16731360（2015）01004304AbstractWiththeicebreakingoftheInternetfinance，thefinancialindustrycomestorecognizethemag-neticeffectoftheInternetWiththecomingofthebigdataera，whatshouldtheinsuranceindustrydo?

@#@Bigdataaffectsthemarketing，management，researchanddevelopmentoftheinsuranceindustryTheinsuranceindustryhastriedvariouspathstopromotebusinessdevelopmentthroughthedataandrelevanttechnologytoservetheso-cietyThisarticlelistssomeinsurancecompaniesinnovationpracticeinadvertisingandmarketing，productde-velopment，pricing，underwritingandclaimingsettlement，customerservice，whichwillprovidesomereferencesfortheinsuranceindustrytodealwithbigdatacorrectlyKeywordsInsurance;@#@BigData;@#@DataMining;@#@Internet随着云计算、物联网、大数据等新技术不断的涌现，保险行业开始意识到大数据及IT技术变革带来的机遇。

@#@随着社交网络的成熟，移动网络带宽的提升，云计算应用的丰富，更多传感器、移动设备、智能终端接入到网络，物联网的迅速发展，由此产生的数据将呈现爆炸式增长。

@#@而在这种技术趋势下，拥有大量原始数据金矿的保险行业，由于采取谨慎的态度，发展一直很缓慢，因此，保险公司的积极应对与转型，已经成为一个既关键又迫切的问题。

@#@一、背景据中国互联网络发展状况统计报告显示，截至2013年12月，中国网民规模达618亿，手机网民规模达5亿，互联网普及率为458%，火山喷发式增长的各种国家、公司业务性的结构化数据，社交、搜索、公共监管等非结构化数据，分析和应用这些数据的可视化技术，及带来的思维模式的变革，把人们带入了全新的大数据时代。

@#@而保险的核心基础是大数法则，数据分析与计算决定了保险企业产品的定价能力，所以对大数据分析和掌控能力对保险行业意义更为重大。

@#@大数据带来更多的跨界融合，更多的商机，更容易产生颠覆性创新，可以说大数据不仅仅是一种数据资源、一种IT技术，更是一种应用工具、一种发展趋势。

@#@二、大数据影响保险业的主要环节保险天然就具有大数据的特征，一是保险行业是经营风险的行业，要利用风险模型或数理技术等对标的物的风险进行评定;@#@二是保险公司的利润主作者简介:

@#@尹会岩（1979），男，回族，辽宁营口人，中级经济师，硕士研究生，现就职于中国人民财产保险股份有限公司沈阳监察稽核中心，研究方向:

@#@保险、审计。

@#@保险职业学院学报（双月刊）2015年第1期要来源于收取的保费和未来的赔付支出的差额，保险公司先要对这些风险发生的概率进行预测，而大数据的一个关键核心就是预测;@#@三是保险经营的每个过程都和大数据密不可分。

@#@业务系统中的保单数据及保单维持数据及核保理赔数据，保费投资经营的投资理财数据，精算部门定价数据，各类风险管理数据，财务乃至宏观管理数据。

@#@从信息量来看，保险行业的大数据时代早已经提前到来。

@#@随着信息技术的发展，保险公司每时每刻都要积累着大量的数据信息，数据量的级别呈现爆炸式的增长。

@#@目前，保险行业在大数据战略和网络经营等方面进行了积极的探索，2013年有60多家保险公司开展了网上保险业务，人保集团建设完成了企业私有云计算平台，并准备开展车联网的试点。

@#@平安与百度联手研究车险用户基于互联网的行为模式。

@#@泰康人寿利用微博搜索引擎、社交网站等途径优化品牌管理，加强客户关系等。

@#@从当前情况看，大数据对保险行业的影响主要表现在以下几个环节上:

@#@

（一）广告营销大数据概念出现之前，广告宣传手段主要是通过传统媒体如电视、广告牌等等，每个用户看到的广告都是一样的，若该用户没有相关需求，此条广告就没有产生效果。

@#@现在随着大数据及网络的发展和进步，营销方面产生很多数据洞察相关的挖掘，通过一种可测量的技术判断目标客户，从而分析锁定对应的客户，进行针对性的营销，为企业节约了投放成本。

@#@大数据时代的广告营销，不是用同一个广告及营销手段针对所有群体，而是采用针对细分的群体进行宣导营销。

@#@如采用行为的数据，意图的数据，情绪的数据等等进行细分，并且可以区分用户是曾经关注过该类产品或是偶然点击，确定什么样的时段更合适等等。

@#@保险行业可以通过精准营销来寻找有保险需求的目标客户，并开展针对性的营销手段，根据客户需求推送相关保险产品，而不是采用扰民的信息群发推广方式，避免客户产生反感，从而对保险产生抵触情绪。

@#@平安财险公司在大数据应用上进行了多年的尝试。

@#@通过从客户搜索轨迹分析客户的需求，并勾勒出数据背后人的特征，不仅仅在消费者直接搜索“车险”的时候进行品牌沟通与宣传，而是突破了只关注车主与保险的局限性，以一个产业链来深入了解车主的需求，全方位了解与车相关的消费生活，与车主建立沟通，收到良好的效果。

@#@目前，除了通过主动的搜索会了解客户外，微信的应用也爆发式地增长。

@#@通过微信的关注，我们能够了解客户的爱好，对应于爱好可以适当地进行产品营销，将是未来一段时间内的发展趋势。

@#@

（二）产品开发保险产品开发是指保险公司基于自身发展和保险市场需求而创新产品或对现有产品进行改良、组合，以适应市场需要、提高自身竞争力的过程或行为。

@#@产品设计主要以客户需求为基础。

@#@对于财产保险而言，主要满足客户规避各种可保风险所致的财产及相关利益损失等方面的需求;@#@对于人身保险而言，各种产品主要是满足客户保障、养老、健康、伤残等方面的需求。

@#@保险产品的价值是能够通过经济补偿与保险金给付提供财务保障。

@#@保险产品的开发是保险经营活动中的重要内容，它对于增强保险公司的竞争力、增力保险公司的收益、满足保险消费者的需求方面都具有重要的意义，也是保险公司其他经营活动的前提，是保险经营活动的起点，保险是以风险的承保为经营对象的业务，但是并不是所有的风险都能够作为可保风险，这就需要在保险产品开发的过程中确定可保风险、保险标的、保险金额、保险责任、保险期限等。

@#@保险产品的开发是保险公司争夺更多的市场份额，提高经济效益的重要手段。

@#@保险产品的开发客观上推动了保险公司精算能力和风险管理能力的提高，可以更好地满足人们的保险需求，而产品开发主要是基于承保标的风险已知的相关数据来预测损失情况，目前保险行业的产品开发主要以积累的大规模数据，对客户进行细分，当数量足够多时，就可以开发针对不同群体客户的具体产品，而如果数据量足够大时，甚至可以提供针对个人的满足其需求的产品。

@#@（三）承保定价随着互联网的普及，汽车数字化也已成为发展趋势。

@#@在互联网及IT技术盛行的时代，汽车必将成为能移动的互联网计算机。

@#@汽车数字化将实现442015年第1期（总第158期）尹会岩:

@#@论大数据对中国保险业的影响自动驾驶、汽车的自我状态检测、自动导航等功能，并将各类信息进行数字化包括维修、驾驶路线、事故录像、关键部件的状态，甚至驾驶习惯（如刹车和加速）都将记录存储以便与分析利用。

@#@在保护隐私的前提下，一旦数字化汽车产生的大数据通过互联网存储和分享，势必引发车险商业模式的重构。

@#@保险公司通过数据分析，可以掌握客户车辆主要用途、基本行车路线、路途的风险程度、驾驶习惯、事故发生频率等信息，还可以掌握客户车辆的使用状况，如是否定期保养、胎压是否保持正常、刹车是否符合标准等信息。

@#@有了这些信息，保险公司就可测评出该客户车辆的风险指数，从而实现对该客户车险费率的“私人定制”。

@#@在大数据的支持下，保险公司可以真正以客户为中心，把客户分为成千上万种，每个客户都有个性化的解决方案，这样保险公司经营就完全可以实现差别费率，对于风险低的客户敢于大胆降低费率，对于风险高的客户提高费率甚至拒绝承保，这样保险公司之间就可以实现真正的差异化竞争。

@#@而拥有大数据技术并能利用大数据的保险公司将拥有压倒性的竞争优势，大数据的运用能力将成为保险公司最核心的竞争力。

@#@保险就是基于风险概率评估，大数据是准确评估风险概率最有利的工具。

@#@大数据时代的来临，保险经营更多的依靠数据支持，不断进行风险细化，不久的将来完全可能通过个人的公共数据情况、信息体系、社交网络、健康数据、性格等信息，得出个人的风险情况，投保时实现以人为别的承保定价。

@#@（四）保险索赔在大数据时代，保险公司通过公共信息实时获得客户的出险信息，并及时主动联系保险客户提供理赔等服务。

@#@如某客户在高速公路上驾车出险，该客户向交警报案，保险公司就能够及时获得报案信息，在客户没有向保险公司提出理赔申请之前，主动向客户提供理赔服务;@#@保险公司通过与修理行业的合作获取每辆汽车的维修、保养情况，查勘时查勘员很容易判断是否为旧伤部位出险，并对该受损进行比例赔付，避免客户从保险中不当得利。

@#@除了提高保险索赔的准确性与及时性，更主要的是防止保险欺诈。

@#@目前，保险公司主要依靠一些固定标准和理赔人员的经验，来判断是否存在保险欺诈。

@#@由于缺乏行业内协作机制和共享的信息平台，调查的质量主要依赖于理赔人员的个人素质以及公安机关的合作情况。

@#@许多大案是凭借理赔人员的经验和责任心，以及公安机关的介入，才能取得相关证据。

@#@然而，经验无法复制，并且在面对大量新型保险欺诈时，保险公司及理赔部门难免捉襟见肘、疲于应付。

@#@而从本质上看，欺诈是由于双方信息不对称所导致的，大数据能够弱化部分不对称的信息，从而避免保险公司赔付成本上升，间接降低所有投保人获取保单的成本，保障了所有投保人的正当权益。

@#@随着各部门的合作和经验的积累，在数据完善积累的基础上循序渐进，从特征分析、因子分析和网络分析入手，建立高效的反欺诈鉴别机制，也许只是时间问题。

@#@（五）客户服务在大数据时代，保险行业可以实时捕捉客户的保险需求，并对保险需求进行客户群细分，从而掌握到哪些客户具有保险需求，有保险需求的客户需要哪种保险产品，从中找到潜在客户群及具体需要的保险产品，最终由相应销售渠道或销售人员进行推荐介绍。

@#@大数据技术将提高保险行业竞争力，降低销售误导，重塑保险行业守信用、担风险、重服务的形象。

@#@友邦保险3年前已经开始做客户细分的工作，通过20年积累的客户数据，用科学的方法细分客户需求，改进产品设计和服务质量。

@#@开通了网上服务自助平台及微信服务平台，开发“客户地图”等系统工具，帮助销售人员科学管理和分析客户在不同人生阶段的保障、理财需求，试验的O2O模式，已经初见成效，线上的精准定位和前期需求挖掘，与线下高效的销售流程相结合，有效提升了客户体验，也为企业创造了价值。

@#@大数据时代给保险企业真正了解客户的机会，基于大数据技术的客户需求获取、客户需求体验、客户满意度的调查等等与客户的交互，均可以采用“全量”方式，并且创新交互维度和视角。

@#@当保险行业全面掌握客户的需求后，推出客户需求的保险54保险职业学院学报（双月刊）2015年第1期产品，以客户接受的方式，推荐给客户，解决客户与保险主体之间的信息不对称导致的销售误导，解决了客户体验问题，保险行业也在满足客户的同时，实现销售的最大化与社会价值的最大化。

@#@三、保险行业的展望对于保险行业来说，大数据时代既是机遇，也是挑战，保险行业需要不断改革和创新。

@#@只有改变旧思维、打破旧模式，进行行业再造，才能实现凤凰涅槃。

@#@要以“数据为生、客户为先、服务为王”的宗旨，满足客户需求，提升客户服务手段，为保险行业带来新的发展。

@#@一是保险行业服务理念更加清晰。

@#@未来保险行业的服务理念，就是以客户为中心，满足客户的需求、注重客户服务体验，通过大数据的挖掘与分析，了解客户、服务客户，以服务赢得客户的信赖，用最高的费效比提供最佳的客户体验度和满意度。

@#@二是保险行业的经营模式更先进。

@#@在云计算、商业智能、数据挖掘等技术支撑下，充分利用大数据，实现精准营销，精确捕捉客户需求，完成产品销售，并提供优质服务，并通过服务流程的再造，不断提升客户体验度和满意度，推动客户通过社交网络与熟人圈子传递公司优质服务的讯息，使口碑向外层层扩散，争取赢得更多的潜在客户。

@#@在大数据时代挑战与机遇并存，大数据时代并不只是数字和算法，计算机依然无法完全替代人的作用。

@#@大数据为我们决策提供参考，而不是最终结果，更好的解决方案永远在不久的将来。

@#@大数据时代是保险行业实践中国梦的良机，它将使保险销售和保险消费都回归经营本原，通过风险评估计算的最大化来增加保险深度与广度，最终促进保险市场繁荣、稳定;@#@通过保险供给与保险需求和谐统一，最终使保险行业取信于民、保障于民;@#@通过消除销售误导等不和谐因素，最终让保险发挥社会稳定器和经济助推器的作用;@#@同时保险企业必须具备相应的风险控制能力，防止大数据带来的风险，避免在瞬间赔掉过去几十年的积累。

@#@参考文献1维克托迈尔舍恩伯格大数据时代:

@#@生活、工作与思维的大变革M周涛，译杭州:

@#@浙江人民出版社，20122王薇大数据时代将在本质上挑战保险业J中国保险报，2013，（03）:

@#@893王薇车险客户细分需依赖大数据J中国保险报，2014，（02）:

@#@894王薇保险:

@#@谁拥有数据谁拥有未来J中国保险报，2011，（08）:

@#@785张宁，郭楠大数据背景下的寿险产品定价与创新研究J海南金融，2014，（01）:

@#@53576邬贺铨大数据时代的机遇与挑战J求是，2013，（04）:

@#@47497姚奕大数据:

@#@让保险欺诈无所遁形J中国保险报，2013，（06）:

@#@788高嵩首个大数据客户体验报告出炉J中国保险报，2014，（03）:

@#@239尹会岩等解读平安财险的大数据营销J中国金融电脑，2014，（04）:

@#@737510张紫第33次中国互联网发展状况统计报告J计算机与网络，2014，（01）:

@#@5511张则鸣浅谈大数据与保险业的未来J上海保险，2014，（02）:

@#@2126（责任编辑:

@#@何厚发）64";i:

1;s:

10700:

"SPSSSPSS操作：

@#@二分类操作：

@#@二分类LogisticLogistic回归回归作者：

@#@张耀文作者：

@#@张耀文11、问题与数据、问题与数据某呼吸内科医生拟探讨吸烟与肺癌发生之间的关系，开展了一项成组设计的病例对照研究。

@#@选择该科室内肺癌患者为病例组，选择医院内其它科室的非肺癌患者为对照组。

@#@通过查阅病历、问卷调查的方式收集了病例组和对照组的以下信息：

@#@性别、年龄、BMI、COPD病史和是否吸烟。

@#@变量的赋值和部分原始数据见表1和表2。

@#@该医生应该如何分析？

@#@表1.肺癌危险因素分析研究的变量与赋值因素变量名赋值说明研究对象编号ID性别gender男=1，女=0年龄ageBMIBMIBMI25=0；@#@BMI25=1COPD病史COPD无=0；@#@轻/中度=1；@#@重度=2吸烟smoke无=0；@#@曾吸/现吸=1肺癌cancer对照=0；@#@病例=1表2.部分原始数据IDgenderageBMICOPDsmokecancer10340110213201013027011141280110512901006060020071290011812911119137010010017000011020001112135000013017101122、对数据结构的分析、对数据结构的分析该设计中，因变量为二分类，自变量（病例对照研究中称为暴露因素）有二分类变量（性别、BMI和是否吸烟）、连续变量（年龄）和有序多分类变量（COPD病史）。

@#@要探讨二分类因变量与自变量之间的关系，应采用二分类二分类Logistic回归回归模型模型进行分析。

@#@在进行在进行二分类二分类Logistic回归回归（包括其它（包括其它Logistic回归回归）分析分析前前，如果样本不如果样本不多而变量较多，多而变量较多，建议先通过单变量分析（建议先通过单变量分析（t检验检验、卡方检验等卡方检验等）考察所有自变量）考察所有自变量与因变量之间的关系，与因变量之间的关系，筛掉一些可能无意义的变量，筛掉一些可能无意义的变量，再再进行多因素分析，这样进行多因素分析，这样可以保证结果更加可靠。

@#@即使样本足够大，也不建议直接把所有的变量放入方可以保证结果更加可靠。

@#@即使样本足够大，也不建议直接把所有的变量放入方程直接分析，一定要先弄清楚各个变量之间的相互关系，程直接分析，一定要先弄清楚各个变量之间的相互关系，确定确定自变量进入方程自变量进入方程的形式，这样才能有效的进行分析。

@#@的形式，这样才能有效的进行分析。

@#@本例中单变量分析的结果见表3（常作为研究报告或论文中的表1）。

@#@表3.病例组和对照组暴露因素的单因素比较病例组（病例组（n=85）对照组对照组（n=259）2/t统计量统计量P性别，男（%）56（65.9）126（48.6）7.6290.01年龄（岁），xs40.314.038.612.41.0810.28BMI，n（%）正常48（56.5）137（52.9）0.3290.57超重或肥胖37（43.5）122（47.1）COPD病史，n（%）无21（24.7）114（44.0）14.1230.01轻中度24（28.2）75（29.0）重度40（47.1）70（27.0）是否吸烟，n（%）否18（21.2）106（40.9）10.8290.01是67（78.8）153（59.1）单因素分析中，病例组和对照组之间的差异有统计学意义的自变量包括：

@#@性别、COPD病史和是否吸烟。

@#@此时，应当考虑应该将哪些此时，应当考虑应该将哪些自变量自变量纳入纳入Logistic回归回归模型。

@#@一般情况下，建模型。

@#@一般情况下，建议议纳入的变量有：

@#@纳入的变量有：

@#@1）单因素分析单因素分析差异差异有统计学有统计学意义的变量意义的变量（此时，此时，最好将最好将P值值放宽一些，比如放宽一些，比如0.1或或0.15等等，避免漏掉一些重要因素避免漏掉一些重要因素）；@#@2）单因素分析时，单因素分析时，没有发现差异有统计学意义，但是没有发现差异有统计学意义，但是临床临床上上认为认为与因变量关系密切的自变量与因变量关系密切的自变量。

@#@本研究中，年龄和BMI与因变量没有统计学关联。

@#@但是，临床认为年龄也是肺癌发生的可能危险因素，因此Logistic回归模型中，纳入以下自变量：

@#@性别、年龄、COPD病史和是否吸烟。

@#@此外此外，对于连续变量，如果仅仅是为了调整该变量带来的混杂（不关心该变，对于连续变量，如果仅仅是为了调整该变量带来的混杂（不关心该变量的量的OR值），则可以直接将值），则可以直接将改改变量纳入变量纳入Logistic回归回归模型；@#@如果关心该变量对模型；@#@如果关心该变量对因变量的影响程度（关心该变量的因变量的影响程度（关心该变量的OR值），一般不直接将该连续变量纳值），一般不直接将该连续变量纳入模型入模型，而是将连续变量转化为而是将连续变量转化为有序多分类有序多分类变量后纳入模型。

@#@变量后纳入模型。

@#@这是因为，在Logistic回归中直接纳入连续变量，那么对于该变量的OR值的意义为：

@#@该变量每升高一个单位，发生结局事件的风险变化（比如年龄每增加1岁，患肺癌的风险增加1.02倍）。

@#@这种解释在临床上大多数是没有意义的。

@#@33、SPSSSPSS分析方法分析方法

（1）数据录入SPSS

（2）选择AnalyzeRegressionBinaryLogistic（3）选项设置1）主对话框设置：

@#@将因变量cancer送入Dependent框中，将纳入模型的自变量sex,age,BMI和COPD变量Covariates中。

@#@本研究中，纳入age变量仅仅是为了调整该变量带来的混杂（不关心该变量的OR值），因此将age直接将改变量纳入Logistic回归模型。

@#@对于自变量筛选的方法（Method对话框），SPSS提供了7种选择，使用各种方法的结果略有不同，读者可相互印证。

@#@各种方法之间的差别在于变量筛选方法不同，其中Forward:

@#@LR法（基于最大似然估计的向前逐步回归法）的结果相对可靠，但最终模型的选择还需要获得专业理论的支持。

@#@2）Categorical设置：

@#@该选项可将多分类变量（包括有序多分类和无序多分类）变换成哑变量，指定某一分类为参照。

@#@本研究中，COPD是多分类变量，我们指定“无COPD病史”的研究对象为参照组，分别比较“轻/中度”和“重度”组相对于参照组患肺癌的风险变化。

@#@点击Categorical将左侧Covariates中的COPD变量送入右侧CategoricalCovariates中。

@#@点击Contrast右侧下拉菜单，选择Indicator（该下拉菜单内的选项是几种与参照比较的方式，Indicator方式最常用，其比较方法为：

@#@方式最常用，其比较方法为：

@#@第一类或第一类或最后一类为参照类最后一类为参照类，每一类与参照类比较，每一类与参照类比较）。

@#@在ReferenceCategory的右侧选择First（表示选择变量COPD中，赋值最小的，即“0”作为参照。

@#@如果选择Last则表示以赋值最大的作为参照）点击Change点击Continue。

@#@3）Options设置中，勾选如下选项及其意义：

@#@Hosmer-Lemeshowgoodness-of-fit：

@#@检验模型的拟合优度；@#@CIforexp（B）：

@#@结果给出OR值的95%可信区间；@#@DisplayAtlaststep：

@#@仅展示变量筛选的最后一步结果。

@#@Continue回到主界面OK44、结果解读、结果解读Logistic回归的结果给出了很多表格，我们仅需要重点关注三个表格。

@#@

（1）OmnibusTestsofModelCoefficients：

@#@模型系数的综合检验。

@#@其中Model一行输出了Logistic回归模型中所有参数是否均为0的似然比检验结果。

@#@P0.05），认为当前数据中的信息已经被充分提取，模型拟合优度较高。

@#@（3）VariablesintheEquation：

@#@1）由于本次统计过程中筛选变量的方式是Forward:

@#@LR法，因此VariablesintheEquation表格中列出了最终筛选进入模型的变量和其参数。

@#@其中Sig.一列表示相应变量在模型中的P值，Exp（B）和95%CIforEXP（B）表示相应变量的OR值和其95%可信区间。

@#@对于sex,smoke这两个二分类变量，OR值的含义为：

@#@相对于赋值较低的研究对象（sex赋值为“0”的为女性；@#@smoke赋值为“0”的为不吸烟），赋值较高的研究对象（男性、吸烟者）发生肺癌的风险为是多少（2.308倍、3.446倍）。

@#@2）对于多分类变量COPD，设置中以“0”组作为参照，则得到的结果是“1”组、“2”组分别对应于“0”组的OR值。

@#@在在Logistic回归中回归中，设置过哑变量的设置过哑变量的多分类变量是同进同出的多分类变量是同进同出的，即只要有即只要有一组相对于参照组的一组相对于参照组的OR值值有统计学意义，有统计学意义，则该变量则该变量的的全部分组均全部分组均纳入模型。

@#@纳入模型。

@#@COPD变量的第一行没有OR值，其P值代表该变量总体检验的差异有统计学意义（即至少有一组相对于参照组的OR值有统计学意义）。

@#@3）本研究中的COPD变量以“0”组作为参照，因此COPD

（1）行的参数中给出了“1”相对于“0”组的OR值和P值，而在COPD

（2）行的参数中给出了“2”组相对于“0”组的OR值和P值。

@#@4）Constant为回归方程的截距，在模型中一般没有实际意义，大家可不必关注。

@#@55、撰写结论、撰写结论本研究发现，85例肺癌患者中，吸烟者67例（78.8%）；@#@259例非肺癌患者中，吸烟者153例（59.1%），肺癌患者和非肺癌患者中的吸烟率的差异有统计学意义（2=10.829,P0.01）。

@#@Logistic回归模型在调整了性别和COPD病史后，吸烟者相对于不吸烟者，发生肺癌的风险增加（OR=3.45,95%CI:

@#@1.86-6.40）。

@#@多变量分析的结果见表4（常作为研究报告或论文中的表2）。

@#@表4.肺癌危险因素的Logistic回归分析OR（95%CI）P值性别女1.00男2.31（1.34-3.97）0.01COPD病史无1.00轻/中度1.58（0.81-3.10）重度3.60（1.90-6.82）0.01吸烟无1.00有3.45（1.86-6.40）0.01更多统计学教程，可关注“医咖会”微信公众号。

@#@";i:

2;s:

"";}

展开阅读全文