Nested domain obtained segmentation fault

Discuss the nesting capability within the model itself and any problems you might have run into.

Nested domain obtained segmentation fault

Postby confu9012 » Wed Nov 19, 2014 7:59 am

Hello, I am trying to run a WRF3.6.1 based on a certain GPV.

When max_dom = 1 or 2, it executes it to the last.
([wrf: SUCCESS COMPLETE WRF] is written at the end of the rsl.error[out].00xx.)

In the case of max_dom = 3, 4, 5:
WRF stops in the 'rrtm'(long wave radiation scheme?) in the case of cu_physics=2,3,4,5. (same number as all domain)
WRF stops in the 'kf_eta_cps'(cumulus scheme?) in the case of cu_physics=1.
All WRF stops with 'rrtm' at the time when radt parameter is reduced, it is not related to the value of cu_physics.
(ex. 2 minutes after start in case of radt=2,2,2,2,2)

Where do I correct for namelist or environment to execute WRF to the last also in the case of max_dom = 5 ?

Could you help me someone?


Environment:
OS:CentOS6.6(Kernel:2.6.32-504.1.3.el6.x86_64, 3.16.7 as same)
CPU:24 cores, ht(48 threads)
MEM:64GB
CC:gcc
FORTRAN:gfortran

wrf:3.6.1( All updates as of Nov 17, 2014 have been built in. )
./configure: 35(dm+sm), 1(basic nesting)
./compile em_real
mpich: v3.1.3( v2 as same)

$ ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) unlimited
max locked memory (kbytes, -l) unlimited
max memory size (kbytes, -m) unlimited
open files (-n) 4096
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) unlimited
real-time priority (-r) 0
stack size (kbytes, -s) unlimited
cpu time (seconds, -t) unlimited
max user processes (-u) 65536
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
$

namelist.wps:
Code: Select all
&share
 wrf_core = 'ARW',
 max_dom = 5,
 start_date = '2014-11-11_03:00:00', '2014-11-11_03:00:00', '2014-11-11_03:00:00', '2014-11-11_03:00:00', '2014-11-11_03:00:00',
 end_date   = '2014-11-11_09:00:00', '2014-11-11_09:00:00', '2014-11-11_09:00:00', '2014-11-11_09:00:00', '2014-11-11_09:00:00',
 interval_seconds = 10800,
 io_form_geogrid = 2,
 opt_output_from_geogrid_path = '[OUTPUT_DIRECTORY]',
 debug_level = 1000,
/

&geogrid
 parent_id                           =   1,        1,         2,         1,         4,
 parent_grid_ratio                   =   1,        2,         5,         2,         5,
 i_parent_start                      =   1,       61,        38,       127,        38,
 j_parent_start                      =   1,       57,        37,       103,        37,
 e_we                                = 241,      115,       191,       121,       216,
 e_sn                                = 253,      111,       186,       119,       211,
 geog_data_res     = 'default', 'default', 'default', 'default', 'default',
 dx = 0.125,
 dy = 0.1,
 map_proj =  'lat-lon',
 ref_lat   = (center of latitude),
 ref_lon   = (center of longitude),
 stand_lon = (standard longitude),
 geog_data_path = '[GEOG_DATA_DIRECTORY]'
/

&ungrib
 out_format = 'WPS',
 prefix = '[UNGRIB_OUTPUT_DIRECTORY]',
/

&metgrid
 fg_name = '[METGRID_INPUT_DIRECTORY]',
 io_form_metgrid = 2,
 opt_output_from_metgrid_path = './',
 opt_metgrid_tbl_path = './metgrid/',
/

&mod_levs
 press_pa = 201300, 200100,
            100000 ,  97500,
             95000 ,  92500,
             90000 ,  85000 ,
             80000 ,  70000 ,
             60000 ,  50000 ,
             40000 ,  30000 ,
             25000 ,  20000 ,
             15000 ,  10000 ,
              5000 ,
 /


&domain_wizard
 grib_data_path = '[GRIB2_DATA_DIRECTORY]',
 grib_vtable = 'null',
 dwiz_name    = [GPV_NAME]
 dwiz_desc    = [GPV_FULL_NAME]
 dwiz_user_rect_x1 =1688
 dwiz_user_rect_y1 =226
 dwiz_user_rect_x2 =1857
 dwiz_user_rect_y2 =393
 dwiz_show_political =true
 dwiz_center_over_gmt =true
 dwiz_latlon_space_in_deg =10
 dwiz_latlon_linecolor =-8355712
 dwiz_map_scale_pct =12.5
 dwiz_map_vert_scrollbar_pos =0
 dwiz_map_horiz_scrollbar_pos =1328
 dwiz_gridpt_dist_km =47.0
 dwiz_mpi_command =null
 dwiz_tcvitals =null
 dwiz_bigmap =Y
/


namelist.input:
Code: Select all
 &time_control
 run_days                            = 0,
 run_hours                           = 6,
 run_minutes                         = 0,
 run_seconds                         = 0,
 start_year                          = 2014,  2014,  2014,  2014,  2014,
 start_month                         = 11,    11,    11,    11,    11,
 start_day                           = 11,    11,    11,    11,    11,
 start_hour                          = 03,    03,    03,    03,    03,
 start_minute                        = 00,    00,    00,    00,    00,
 start_second                        = 00,    00,    00,    00,    00,
 end_year                            = 2014,  2014,  2014,  2014,  2014,
 end_month                           = 11,    11,    11,    11,    11,
 end_day                             = 11,    11,    11,    11,    11,
 end_hour                            = 09,    09,    09,    09,    09,
 end_minute                          = 00,    00,    00,    00,    00,
 end_second                          = 00,    00,    00,    00,    00,
 interval_seconds                    = 10800,
 input_from_file                     = .true., .true., .true., .true., .true.,
 history_interval                    = 2, 2, 2, 2, 2,
 frames_per_outfile                  = 1,    1,    1,    1,    1,
 restart                             = .false.,
 restart_interval                    = 2880,
 io_form_history                     = 2,
 io_form_restart                     = 2,
 io_form_input                       = 2,
 io_form_boundary                    = 2,
 fine_input_stream                   = 2,         2,         2,         2,         2,
 io_form_auxinput2                   = 2,
 debug_level                         = 500,
/

 &domains
 time_step                           = 120,
 time_step_fract_num                 = 0,
 time_step_fract_den                 = 1,
 max_dom                             = 5,
 e_we                                = 241,      115,       191,       121,       216,
 e_sn                                = 253,      111,       186,       119,       211,
 e_vert                              = 17,      17,        17,      17,        17,
 p_top_requested                     = 5000,
 num_metgrid_levels                  = 18,
 num_metgrid_soil_levels             = 0,
 dx                                  = 13897.185, 6948.5925, 1389.7185, 6948.5925, 1389.7185
 dy                                  = 11117.748, 5558.8740, 1111.7748, 5558.8740, 1111.7748
 grid_id                             = 1,         2,         3,      4,         5,
 parent_id                           =   1,        1,         2,         1,         4,
 i_parent_start                      =   1,       61,        38,       127,        38,
 j_parent_start                      =   1,       57,        37,       103,        37,
 parent_grid_ratio                   =   1,        2,         5,         2,         5,
 parent_time_step_ratio              = 1,         1,         1,      1,         1,
 feedback                            = 0,
 smooth_option                       = 0,
 vert_refine_fact = 3,
 sfcp_to_sfcp                        = .true.,
 max_dz                              = 5000,
 use_surface                         = .true.,
 /

 &physics
 mp_physics                          = 3,     3,     3,     3,     3,
 ra_lw_physics                       = 1,     1,     1,     1,     1,
 ra_sw_physics                       = 1,     1,     1,     1,     1,
 radt                                = 30,    30,    30,    30,    30,
 sf_sfclay_physics                   = 1,     1,     1,     1,     1,
 sf_surface_physics                  = 0,     0,     0,     0,     0,
 bl_pbl_physics                      = 1,     1,     1,     1,     1,
 bldt                                = 0,     0,     0,     0,     0,
 cu_physics                          = 5,     5,     5,     5,     5,
 cudt                                = 5,     5,     5,     5,     5,
 isfflx                              = 1,
 ifsnow                              = 1,
 icloud                              = 1,
 surface_input_source                = 1,
 num_soil_layers                     = 4,
 sf_urban_physics                    = 0,     0,     0,     0,     0,
/

 &fdda
 /

 &dynamics
 w_damping                           = 0,
 diff_opt                            = 1,      1,      1,      1,      1,
 km_opt                              = 4,      4,      4,      4,      4,
 diff_6th_opt                        = 2,      2,      2,      2,      2,
 diff_6th_factor                     = 0.12,   0.12,   0.12,   0.12,   0.12,
 base_temp                           = 290.
 damp_opt                            = 0,
 zdamp                               = 5000.,  5000.,  5000.,  5000.,  5000.,
 dampcoef                            = 0.2,    0.2,    0.2,    0.2,    0.2,
 khdif                               = 0,      0,      0,      0,      0,
 kvdif                               = 0,      0,      0,      0,      0,
 non_hydrostatic                     = .true., .true., .true., .true., .true.,
 moist_adv_opt                       = 1,      1,      1,      1,      1,
 scalar_adv_opt                      = 1,      1,      1,      1,      1,
 /

 &bdy_control
 spec_bdy_width                      = 5,
 spec_zone                           = 1,
 relax_zone                          = 4,
 specified                           = .true., .false.,.false., .false.,.false.,
 nested                              = .false., .true., .true., .true., .true.,
 /

 &grib2
 /

 &namelist_quilt
 nio_tasks_per_group = 0,
 nio_groups = 1,
 /

 &dfi_control
 /



$ mpiexec -n 45 ./wrf.exe
starting wrf task 24 of 45
starting wrf task 34 of 45
starting wrf task 42 of 45
starting wrf task 0 of 45

(omission)

starting wrf task 25 of 45
starting wrf task 29 of 45
starting wrf task 44 of 45
starting wrf task 37 of 45

===================================================================================
= BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
= PID 3617 RUNNING AT MACHINE
= EXIT CODE: 11
= CLEANING UP REMAINING PROCESSES
= YOU CAN IGNORE THE BELOW CLEANUP MESSAGES
===================================================================================
YOUR APPLICATION TERMINATED WITH THE EXIT STRING: Segmentation fault (signal 11)
This typically refers to a problem with your application.
Please see the FAQ page for debugging suggestions
$


In addition, in the case of "parent_grid_ratio=3", it was the result same as "max_dom=2."
Code: Select all
 time_step                           = 120,
 time_step_fract_num                 = 0,
 time_step_fract_den                 = 1,
 max_dom                             = 5,
 e_we                                = 241,      172,       112,       184,       130,
 e_sn                                = 253,      169,       109,       178,       127,
 e_vert                              = 17,      17,        17,      17,        17,
 p_top_requested                     = 5000,
 num_metgrid_levels                  = 18,
 num_metgrid_soil_levels             = 0,
 dx                                  = 13897.185, 4632.395, 1544.13167, 4632.395, 1544.13167
 dy                                  = 11117.748, 3705.916, 1235.3053,  3705.916, 1235.3053
 grid_id                             = 1,         2,         3,      4,         5,
 parent_id                           =   0,        1,         2,         1,         4,
 i_parent_start                      =   1,       61,        57,       127,        57,
 j_parent_start                      =   1,       57,        55,       103,        55,
 parent_grid_ratio                   =   1,        3,         3,         3,         3,
 parent_time_step_ratio              = 1,         1,         1,      1,         1,
 feedback                            = 0,
 smooth_option                       = 0,
 vert_refine_fact = 3,
 sfcp_to_sfcp                        = .true.,
 max_dz                              = 5000,
 use_surface                         = .true.,



cu_physics = 5
Last several lines of rsl.error.0000:
Code: Select all
output_wrf: back from wrf_iosync
 output_wrf: end, fid =            2
 med_hist_out: opened wrfout_d03_2014-11-11_03:30:00 as DATASET=AUXHIST0
module_io.F: in wrf_ioclose
Timing for Writing wrfout_d03_2014-11-11_03:30:00 for domain        3:    5.89379 elapsed seconds
in med_latbound_in
module_integrate: calling solve interface
 grid spacing, dt, time_step_sound=   1111.7748       120.00000              66
 call rk_step_prep
calling inc/HALO_EM_A_inline.inc
calling inc/PERIOD_BDY_EM_A_inline.inc
 call rk_phys_bc_dry_1
 call init_zero_tendency
calling inc/HALO_EM_PHYS_A_inline.inc
 call phy_prep
 DEBUG wrf_timetoa():  returning with str = [2014-11-11_03:30:00]
 call radiation_driver
Top of Radiation Driver
CALL cldfra1
CALL rrtm
 CAM-CLWRF interpolated values______ year:        2014  julian day:   314.14584
   CAM-CLWRF co2vmr:   3.79000004613772035E-004  n2ovmr:  3.19000008630609955E-007  ch4vmr:  1.77399999756744364E-006


cu_physics = 1
Last several lines of rsl.error.0000:
Code: Select all
output_wrf: back from wrf_iosync
 output_wrf: end, fid =            2
 med_hist_out: opened wrfout_d03_2014-11-11_03:04:00 as DATASET=AUXHIST0
module_io.F: in wrf_ioclose
Timing for Writing wrfout_d03_2014-11-11_03:04:00 for domain        3:    5.93008 elapsed seconds
in med_latbound_in
module_integrate: calling solve interface
 grid spacing, dt, time_step_sound=   1111.7748       120.00000              66
 call rk_step_prep
calling inc/HALO_EM_A_inline.inc
calling inc/PERIOD_BDY_EM_A_inline.inc
 call rk_phys_bc_dry_1
 call init_zero_tendency
calling inc/HALO_EM_PHYS_A_inline.inc
 call phy_prep
 DEBUG wrf_timetoa():  returning with str = [2014-11-11_03:04:00]
 call radiation_driver
Top of Radiation Driver
calling inc/HALO_PWP_inline.inc
 call surface_driver
in SFCLAY
 call pbl_driver
in YSU PBL
 call cumulus_driver
calling inc/HALO_CUP_G3_IN_inline.inc
in kf_eta_cps
 WOULD GO OFF TOP: KF_ETA_PARA I,J,DPTHMX,DPMIN           2           2             NaN   5000.0000


Best regards.
confu9012
 
Posts: 3
Joined: Sun Nov 16, 2014 9:25 pm

Re: Nested domain obtained segmentation fault

Postby mark_daryl » Wed Jan 28, 2015 4:14 am

Hi


i have teh same problem,

do you have a solution?


Thanks in advance
mark_daryl
 
Posts: 13
Joined: Tue Mar 15, 2011 9:24 am

Nested domain obtained segmentation fault

Postby mJacobsensl » Mon Mar 16, 2015 7:05 am

so using putty:

Every time we use "lmotor2 = wpilib.Talon1" we get a segmentation fault. When we replace Talon with Joystick or Timer, the code runs correctly.

We also get this error using "TalonSRX" and "Jaguar".



Thanks,
robotdna
mJacobsensl
 
Posts: 7
Joined: Sun Dec 14, 2014 9:18 pm

Re: Nested domain obtained segmentation fault

Postby mark_daryl » Sun Aug 09, 2015 2:59 am

I have the same problem for v3.7
anybody who has a solution?

Thanks
Ram
mark_daryl
 
Posts: 13
Joined: Tue Mar 15, 2011 9:24 am

Re: Nested domain obtained segmentation fault

Postby confu9012 » Fri Sep 30, 2016 4:59 am

Hello.

Solution.
I was rebuilding kernel of CentOS6.

Thanks.
confu9012
 
Posts: 3
Joined: Sun Nov 16, 2014 9:25 pm


Return to Nesting

Who is online

Users browsing this forum: No registered users and 1 guest

cron