Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Problem with master branch #147

Open
abaillod opened this issue May 27, 2021 · 5 comments
Open

Problem with master branch #147

abaillod opened this issue May 27, 2021 · 5 comments
Assignees

Comments

@abaillod
Copy link
Collaborator

Hello,

I have a problem running the master branch. When running the latest version of the master branch on this simple, circular tokamak input file: Input_0.txt, I get the following output

abaillod@spcpc602:~/Physics/BetaScan/QuasiAxiSymmetric/Nfp2/FixedBoundary_Nvol2/TokamakSequence> ~/SPEC/xspec Input_0.sp             
xspech :            : version =  3.10
       :  compiled  : date    = Thu May 27 10:35:50 CEST 2021 ; 
       :            : srcdir  = /home/abaillod/SPEC ; 
       :            : macros  = macros ; 
       :            : fc      = mpif90 ; 
       :            : flags   =  -r8 -DIFORT -O2 -ip -no-prec-div -xHost -fPIC -
 DOPENMP -fopenmp ; 
xspech :            : 
xspech :       0.00 : date=2021/05/27 , 10:38:14 ; machine precision= 1.11E-16 ; vsmall= 1.11E-14 ; small= 1.11E-12 ;
xspech :            : 
xspech :       0.00 : parallelism : ncpu=  1 ; nthreads= 12 ;
rdcmdl :            : 
rdcmdl :       0.00 : ext = Input_0                                                                                             
xspech :            : 
xspech :       0.00 : begin execution ; calling global:readin ;
readin :            : 
readin :       0.00 : Igeometry=  3 ; Istellsym=  1 ; Lreflect=  0 ;
readin :            : Lfreebound=  0 ; phiedge=  1.000000000000000E+00 ; curtor=  0.000000000000000E+00 ; curpol=  0.000000000000000E+00 ;
readin :            : gamma=  0.000000000000000E+00 ;
readin :            : Nfp=  2 ; Nvol=  2 ; Mvol=  2 ; Mpol=  8 ; Ntor=  6 ;
readin :            : pscale=  1.00000E+00 ; Ladiabatic= 0 ; Lconstraint=  0 ; mupf: tol,its=  1.00E-12 ,1024 ;
readin :            : Lrad = 12, 8,
readin :            : 
readin :       0.00 : Linitialize=  1 ;LautoinitBn=  1 ; Lzerovac= 0 ; Ndiscrete= 2 ;
readin :            : Nquad=  -1 ; iMpol=  -4 ; iNtor=  -4 ;
readin :            : Lsparse= 0 ; Lsvdiota= 0 ; imethod= 3 ; iorder= 2 ; iprecon= 1 ; iotatol= -1.00000E+00 ;
readin :            : Lextrap= 0 ; Mregular= -1 ; Lrzaxis= 2 ; Ntoraxis=12 ;
readin :            : 
readin :       0.00 : LBeltrami= 4 ; Linitgues= 1 ; Lmatsolver= 1 ; LGMRESprec= 1 ; NiterGMRES= 200 ; epsGMRES=  1.00000E-14 ; epsILU=  1.00000E-12 ;
readin :            : 
readin :       0.00 : Lfindzero= 2 ;
readin :            : escale=  0.00000E+00 ; opsilon=  1.00000E+00 ; pcondense=  4.000 ; epsilon=  1.00000E+00 ; wpoloidal= 1.0000 ; upsilon=  1.00000E+00 ;
readin :            : forcetol=  1.00000E-12 ; c05xmax=  1.00000E-06 ; c05xtol=  1.00000E-12 ; c05factor=  1.00000E-04 ; LreadGF= F ; 
readin :            : mfreeits=   0 ; gBntol=  1.00000E-06 ; gBnbld=  6.66000E-01 ;
readin :            : vcasingeps=  1.00000E-12 ; vcasingtol=  1.00000E-08 ; vcasingits=     8 ; vcasingper=     1 ;
readin :            : 
readin :       0.00 : odetol=  1.00E-07 ; nPpts=   500 ;
readin :            : LHevalues= F ; LHevectors= F ; LHmatrix= F ; Lperturbed= 0 ; dpp= -1 ; dqq= -1 ; dRZ=  1.00000000E-05 ; Lcheck=  0 ; Ltiming= F ;
readin :            : 
readin :            : myid=  0 ; Rscale= 1.013889315431735E+00 ;
preset :            : myid=  0 ; Mrad= 12 : Lrad= 12,  8,
preset :       0.00 : LBsequad= F , LBnewton= F , LBlinear= T ;
preset :            : 
preset :       0.00 : Nquad=  -1 ; mn=  111 ; NGdof=   221 ; NAdof=  1223,  1888,
preset :            : 
preset :       0.00 : Nt=    64 ; Nz=    48 ; Ntz=     3072 ;
newton :       0.38 :         0  0 ; |f|= 3.65065E-03 ; time=      0.35s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :       4.70 :         1  1 ; |f|= 3.65065E-03 ; time=      4.68s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       5.06 :         2  1 ; |f|= 7.68354E+06 ; time=      0.36s ; log|BB|e= -2.18
fcn2   :            :              ;                                     ; log|II|o=  6.10
newton :            :
newton :       5.07 : finished ; success        ; ic05p*f= 1 ; its=      2 ,   1 ;
xspech :       5.42 : #freeits=  0 ; |f|= 3.65065E-03 ; time=      0.35s ; log|BB|e= -3.19
xspech :            :              ;                                     ; log|II|o= -4.13

While when I use the version 3.0 of SPEC, I get good convergence, i.e.

abaillod@spcpc602:~/Physics/BetaScan/QuasiAxiSymmetric/Nfp2/FixedBoundary_Nvol2/TokamakSequence> ~/SPEC/xspec_3.0 Input_0.sp
xspech :            : version =  3.00
       :  compiled  : date    = Thu May 27 10:32:18 CEST 2021 ; 
       :            : srcdir  = /home/abaillod/SPEC ; 
       :            : macros  = macros ; 
       :            : fc      = mpif90 ; 
       :            : flags   =  -r8 -O2 -ip -no-prec-div -xHost -fPIC -DOPENMP 
 -fopenmp ; 
xspech :            : 
xspech :       0.00 : begin execution ; ncpu=  1 ; calling global:readin ;
readin :            : 
readin :       0.00 : date=2021/05/27 , 10:39:14 ; machine precision= 1.11E-16 ; vsmall= 1.11E-14 ; small= 1.11E-12 ;
readin :            : 
readin :       0.00 : ext = Input_0                                                                                             
readin :            : 
readin :            : 
readin :       0.00 : Igeometry=  3 ; Istellsym=  1 ; Lreflect=  0 ;
readin :            : Lfreebound=  0 ; phiedge=  1.000000000000000E+00 ; curtor=  0.000000000000000E+00 ; curpol=  0.000000000000000E+00 ;
readin :            : gamma=  0.000000000000000E+00 ;
readin :            : Nfp=  2 ; Nvol=  2 ; Mvol=  2 ; Mpol=  8 ; Ntor=  6 ;
readin :            : pscale=  1.00000E+00 ; Ladiabatic= 0 ; Lconstraint=  0 ; mupf: tol,its=  1.00E-12 ,1024 ;
readin :            : Lrad = 12, 8,
readin :            : 
readin :       0.00 : Linitialize=  1 ;LautoinitBn=  1 ; Lzerovac= 0 ; Ndiscrete= 2 ;
readin :            : Nquad=  -1 ; iMpol=  -4 ; iNtor=  -4 ;
readin :            : Lsparse= 0 ; Lsvdiota= 0 ; imethod= 3 ; iorder= 2 ; iprecon= 1 ; iotatol= -1.00000E+00 ;
readin :            : Lextrap= 0 ; Mregular= -1 ; Lrzaxis= 2 ; Ntoraxis=12 ;
readin :            : 
readin :       0.00 : LBeltrami= 4 ; Linitgues= 1 ; Lmatsolver= 1 ; LGMRESprec= 1 ; NiterGMRES= 200 ; epsGMRES=  1.00000E-14 ; epsILU=  1.00000E-12 ;
readin :            : 
readin :       0.00 : Lfindzero= 2 ;
readin :            : escale=  0.00000E+00 ; opsilon=  1.00000E+00 ; pcondense=  4.000 ; epsilon=  1.00000E+00 ; wpoloidal= 1.0000 ; upsilon=  1.00000E+00 ;
readin :            : forcetol=  1.00000E-12 ; c05xmax=  1.00000E-06 ; c05xtol=  1.00000E-12 ; c05factor=  1.00000E-04 ; LreadGF= F ; 
readin :            : mfreeits=   0 ; gBntol=  1.00000E-06 ; gBnbld=  6.66000E-01 ;
readin :            : vcasingeps=  1.00000E-12 ; vcasingtol=  1.00000E-08 ; vcasingits=     8 ; vcasingper=     1 ;
readin :            : 
readin :       0.00 : odetol=  1.00E-07 ; nPpts=   500 ;
readin :            : LHevalues= F ; LHevectors= F ; LHmatrix= F ; Lperturbed= 0 ; dpp= -1 ; dqq= -1 ; dRZ=  1.00000000E-05 ; Lcheck=  0 ; Ltiming= F ;
readin :            : 
readin :            : myid=  0 ; Rscale= 1.013889315431735E+00 ;
preset :            : myid=  0 ; Mrad= 12 : Lrad= 12,  8,
preset :       0.00 : LBsequad= F , LBnewton= F , LBlinear= T ;
preset :            : 
preset :       0.00 : Nquad=  -1 ; mn=  111 ; NGdof=   221 ; NAdof=  1223,  1888,
preset :            : 
preset :       0.00 : Nt=    64 ; Nz=    48 ; Ntz=     3072 ;
newton :       0.37 :         0  0 ; |f|= 3.65065E-03 ; time=      0.35s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :       4.44 :         1  1 ; |f|= 3.65065E-03 ; time=      4.41s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       4.79 :         2  1 ; |f|= 3.22715E-03 ; time=      0.35s ; log|BB|e= -3.25
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       5.15 :         3  1 ; |f|= 3.06683E-03 ; time=      0.36s ; log|BB|e= -3.24
fcn2   :            :              ;                                     ; log|II|o= -4.19
fcn2   :       5.50 :         4  1 ; |f|= 2.91540E-03 ; time=      0.35s ; log|BB|e= -3.22
fcn2   :            :              ;                                     ; log|II|o= -4.24
fcn2   :       5.85 :         5  1 ; |f|= 2.46889E-03 ; time=      0.35s ; log|BB|e= -3.33
fcn2   :            :              ;                                     ; log|II|o= -4.31
fcn2   :       6.20 :         6  1 ; |f|= 1.67566E-03 ; time=      0.35s ; log|BB|e= -3.55
fcn2   :            :              ;                                     ; log|II|o= -4.49
fcn2   :       6.55 :         7  1 ; |f|= 6.65231E-05 ; time=      0.35s ; log|BB|e= -4.86
fcn2   :            :              ;                                     ; log|II|o= -6.01
fcn2   :       6.91 :         8  1 ; |f|= 2.01360E-05 ; time=      0.35s ; log|BB|e= -5.42
fcn2   :            :              ;                                     ; log|II|o= -7.10
fcn2   :       7.26 :         9  1 ; |f|= 1.50378E-06 ; time=      0.35s ; log|BB|e= -6.54
fcn2   :            :              ;                                     ; log|II|o= -8.08
fcn2   :       7.61 :        10  1 ; |f|= 2.17590E-08 ; time=      0.35s ; log|BB|e= -8.32
fcn2   :            :              ;                                     ; log|II|o= -9.84
fcn2   :       7.96 :        11  1 ; |f|= 1.15298E-09 ; time=      0.36s ; log|BB|e= -9.54
fcn2   :            :              ;                                     ; log|II|o=-11.04
fcn2   :       8.31 :        12  1 ; |f|= 2.72113E-10 ; time=      0.35s ; log|BB|e=-10.28
fcn2   :            :              ;                                     ; log|II|o=-11.91
fcn2   :       8.66 :        13  1 ; |f|= 1.34764E-11 ; time=      0.35s ; log|BB|e=-11.58
fcn2   :            :              ;                                     ; log|II|o=-13.14
fcn2   :       9.01 :        14  1 ; |f|= 2.52154E-12 ; time=      0.35s ; log|BB|e=-12.31
fcn2   :            :              ;                                     ; log|II|o=-13.84
fcn2   :       9.36 :        15  1 ; |f|= 2.19319E-14 ; time=      0.35s ; log|BB|e=-14.23
fcn2   :            :              ;                                     ; log|II|o=-15.99
fcn2   :       9.71 :        16  1 ; |f|= 4.64724E-15 ; time=      0.35s ; log|BB|e=-14.58
fcn2   :            :              ;                                     ; log|II|o=-16.38
newton :            :
newton :       9.72 : finished ; success        ; ic05p*f= 1 ; its=     16 ,   1 ;
xspech :      10.07 : #freeits=  0 ; |f|= 4.64516E-15 ; time=      0.35s ; log|BB|e=-14.58
xspech :            :              ;                                     ; log|II|o=-16.39

Let me also mention that this is a comparison between version 3.0 and the latest version of the master branch - I did

git fetch
git pull origin master
make clean
make BUILD_ENV=intel_spc -j

The same problem appears when running with the branch update_makefile.

I don't know what is causing the problem. This might be due to some compilation issue, since I have been struggling with compilation on my machine for a few weeks. Could somebody try to replicate the problem?

Thanks!

@jonathanschilling
Copy link
Collaborator

@abaillod I just tried with the latest state of the master branch on Arch Linux and SPEC converges with your input file:

xspech :            : version =  3.10
       :  compiled  : date    = Thu May 27 10:51:29 AM CEST 2021 ; 
       :            : srcdir  = /home/jonathan/work/code/SPEC/SPEC ; 
       :            : macros  = macros ; 
       :            : fc      = mpif90 ; 
       :            : flags   = -fPIC -fdefault-real-8 -fallow-argument-mismatch -O3 -ffixed-line-length-none -ffree-line-length-none -fexternal-blas -DOPENMP -fopenmp ; 
xspech :            : 
xspech :       0.00 : date=2021/05/27 , 10:53:08 ; machine precision= 1.11E-16 ; vsmall= 1.11E-14 ; small= 1.11E-12 ;
xspech :            : 
xspech :       0.00 : parallelism : ncpu=  1 ; nthreads=  1 ;
rdcmdl :            : 
rdcmdl :       0.00 : ext = Input_0                                                                                             
xspech :            : 
xspech :       0.00 : begin execution ; calling global:readin ;
readin :            : 
readin :       0.00 : Igeometry=  3 ; Istellsym=  1 ; Lreflect=  0 ;
readin :            : Lfreebound=  0 ; phiedge=  1.000000000000000E+00 ; curtor=  0.000000000000000E+00 ; curpol=  0.000000000000000E+00 ;
readin :            : gamma=  0.000000000000000E+00 ;
readin :            : Nfp=  2 ; Nvol=  2 ; Mvol=  2 ; Mpol=  8 ; Ntor=  6 ;
readin :            : pscale=  1.00000E+00 ; Ladiabatic= 0 ; Lconstraint=  0 ; mupf: tol,its=  1.00E-12 ,1024 ;
readin :            : Lrad = 12, 8,
readin :            : 
readin :       0.00 : Linitialize=  1 ;LautoinitBn=  1 ; Lzerovac= 0 ; Ndiscrete= 2 ;
readin :            : Nquad=  -1 ; iMpol=  -4 ; iNtor=  -4 ;
readin :            : Lsparse= 0 ; Lsvdiota= 0 ; imethod= 3 ; iorder= 2 ; iprecon= 1 ; iotatol= -1.00000E+00 ;
readin :            : Lextrap= 0 ; Mregular= -1 ; Lrzaxis= 2 ; Ntoraxis=12 ;
readin :            : 
readin :       0.00 : LBeltrami= 4 ; Linitgues= 1 ; Lmatsolver= 1 ; LGMRESprec= 1 ; NiterGMRES= 200 ; epsGMRES=  1.00000E-14 ; epsILU=  1.00000E-12 ;
readin :            : 
readin :       0.00 : Lfindzero= 2 ;
readin :            : escale=  0.00000E+00 ; opsilon=  1.00000E+00 ; pcondense=  4.000 ; epsilon=  1.00000E+00 ; wpoloidal= 1.0000 ; upsilon=  1.00000E+00 ;
readin :            : forcetol=  1.00000E-12 ; c05xmax=  1.00000E-06 ; c05xtol=  1.00000E-12 ; c05factor=  1.00000E-04 ; LreadGF= F ; 
readin :            : mfreeits=   0 ; gBntol=  1.00000E-06 ; gBnbld=  6.66000E-01 ;
readin :            : vcasingeps=  1.00000E-12 ; vcasingtol=  1.00000E-08 ; vcasingits=     8 ; vcasingper=     1 ;
readin :            : 
readin :       0.00 : odetol=  1.00E-07 ; nPpts=   500 ;
readin :            : LHevalues= F ; LHevectors= F ; LHmatrix= F ; Lperturbed= 0 ; dpp= -1 ; dqq= -1 ; dRZ=  1.00000000E-05 ; Lcheck=  0 ; Ltiming= F ;
readin :            : 
readin :            : myid=  0 ; Rscale= 1.013889315431735E+00 ;
preset :            : myid=  0 ; Mrad= 12 : Lrad= 12,  8,
preset :       0.01 : LBsequad= F , LBnewton= F , LBlinear= T ;
preset :            : 
preset :       0.01 : Nquad=  -1 ; mn=  111 ; NGdof=   221 ; NAdof=  1223,  1888,
preset :            : 
preset :       0.01 : Nt=    64 ; Nz=    48 ; Ntz=     3072 ;
newton :       5.94 :         0  0 ; |f|= 3.65065E-03 ; time=      5.65s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :      41.10 :         1  1 ; |f|= 3.65065E-03 ; time=     40.81s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :      47.64 :         2  1 ; |f|= 3.22715E-03 ; time=      6.54s ; log|BB|e= -3.25
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :      53.65 :         3  1 ; |f|= 3.06683E-03 ; time=      6.01s ; log|BB|e= -3.24
fcn2   :            :              ;                                     ; log|II|o= -4.19
fcn2   :      59.71 :         4  1 ; |f|= 2.91540E-03 ; time=      6.05s ; log|BB|e= -3.22
fcn2   :            :              ;                                     ; log|II|o= -4.24
fcn2   :      66.11 :         5  1 ; |f|= 2.46889E-03 ; time=      6.41s ; log|BB|e= -3.33
fcn2   :            :              ;                                     ; log|II|o= -4.31
fcn2   :      72.34 :         6  1 ; |f|= 1.67566E-03 ; time=      6.23s ; log|BB|e= -3.55
fcn2   :            :              ;                                     ; log|II|o= -4.49
fcn2   :      79.43 :         7  1 ; |f|= 6.65231E-05 ; time=      7.09s ; log|BB|e= -4.86
fcn2   :            :              ;                                     ; log|II|o= -6.01
fcn2   :      85.46 :         8  1 ; |f|= 2.01360E-05 ; time=      6.04s ; log|BB|e= -5.42
fcn2   :            :              ;                                     ; log|II|o= -7.10
fcn2   :      91.35 :         9  1 ; |f|= 1.50378E-06 ; time=      5.89s ; log|BB|e= -6.54
fcn2   :            :              ;                                     ; log|II|o= -8.08
fcn2   :      97.01 :        10  1 ; |f|= 2.17590E-08 ; time=      5.66s ; log|BB|e= -8.32
fcn2   :            :              ;                                     ; log|II|o= -9.84
fcn2   :     103.50 :        11  1 ; |f|= 1.15299E-09 ; time=      6.48s ; log|BB|e= -9.54
fcn2   :            :              ;                                     ; log|II|o=-11.04
fcn2   :     110.30 :        12  1 ; |f|= 2.72108E-10 ; time=      6.80s ; log|BB|e=-10.28
fcn2   :            :              ;                                     ; log|II|o=-11.91
fcn2   :     116.58 :        13  1 ; |f|= 1.34885E-11 ; time=      6.28s ; log|BB|e=-11.58
fcn2   :            :              ;                                     ; log|II|o=-13.14
fcn2   :     122.38 :        14  1 ; |f|= 2.51593E-12 ; time=      5.80s ; log|BB|e=-12.31
fcn2   :            :              ;                                     ; log|II|o=-13.84
fcn2   :     128.76 :        15  1 ; |f|= 2.02050E-14 ; time=      6.38s ; log|BB|e=-14.21
fcn2   :            :              ;                                     ; log|II|o=-16.00
fcn2   :     135.16 :        16  1 ; |f|= 3.30218E-15 ; time=      6.40s ; log|BB|e=-14.65
fcn2   :            :              ;                                     ; log|II|o=-16.61
newton :            :
newton :     135.17 : finished ; success        ; ic05p*f= 1 ; its=     16 ,   1 ;
xspech :     141.27 : #freeits=  0 ; |f|= 3.29209E-15 ; time=      6.08s ; log|BB|e=-14.65
xspech :            :              ;                                     ; log|II|o=-16.58
xspech :            :
xspech :     141.28 : myid=  0 ; Poincare plot ; odetol= 1.0E-07 ; nPpts=    500 ; nPtrj=   10,   10,
pp00aa :     152.08 : myid=  0 ; lvol=  1 ;   1 : (s,t)=( -0.80000000000000004 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.647755054173649E-01 ;
pp00aa :     162.79 : myid=  0 ; lvol=  1 ;   2 : (s,t)=( -0.59999999999999998 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.646931350510217E-01 ;
pp00aa :     174.07 : myid=  0 ; lvol=  1 ;   3 : (s,t)=( -0.40000000000000002 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.645533044417591E-01 ;
pp00aa :     184.95 : myid=  0 ; lvol=  1 ;   4 : (s,t)=( -0.19999999999999996 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.643557913792603E-01 ;
pp00ab :     185.03 : myid=  0 ; lvol=  1 ; (jj,kk)=(   1 ,   0 ); ifail= 3 ; integration interrupted (more than 5000 calls)                 
pp00aa :     185.03 : myid=  0 ; lvol=  1 ;   5 : (s,t)=(  0.00000000000000000 ,  3.14159265358979312 ) ; utflag=  3 ; transform= -2.000000000000000E+00 ;
pp00aa :     196.12 : myid=  0 ; lvol=  1 ;   6 : (s,t)=(  0.19999999999999996 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.637874816621287E-01 ;
pp00aa :     206.53 : myid=  0 ; lvol=  1 ;   7 : (s,t)=(  0.39999999999999991 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.634169149264225E-01 ;
pp00aa :     217.69 : myid=  0 ; lvol=  1 ;   8 : (s,t)=(  0.60000000000000009 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.629890837599737E-01 ;
pp00aa :     228.69 : myid=  0 ; lvol=  1 ;   9 : (s,t)=(  0.80000000000000004 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.625041209853300E-01 ;
pp00aa :     240.34 : myid=  0 ; lvol=  1 ;  10 : (s,t)=(  1.00000000000000000 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  3.619619902708048E-01 ;
pp00aa :     249.22 : myid=  0 ; lvol=  2 ;   0 : (s,t)=( -1.00000000000000000 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  1.205777185230199E+00 ;
pp00aa :     258.18 : myid=  0 ; lvol=  2 ;   1 : (s,t)=( -0.80000000000000004 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  1.057246269531539E+00 ;
pp00aa :     266.96 : myid=  0 ; lvol=  2 ;   2 : (s,t)=( -0.59999999999999998 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  9.450245657197669E-01 ;
pp00aa :     276.34 : myid=  0 ; lvol=  2 ;   3 : (s,t)=( -0.40000000000000002 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  8.577415867410848E-01 ;
pp00aa :     285.17 : myid=  0 ; lvol=  2 ;   4 : (s,t)=( -0.19999999999999996 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  7.882466287473602E-01 ;
pp00ab :     285.23 : myid=  0 ; lvol=  2 ; (jj,kk)=(   1 ,   0 ); ifail= 3 ; integration interrupted (more than 5000 calls)                 
pp00aa :     285.23 : myid=  0 ; lvol=  2 ;   5 : (s,t)=(  0.00000000000000000 ,  3.14159265358979312 ) ; utflag=  3 ; transform= -2.000000000000000E+00 ;
pp00aa :     293.85 : myid=  0 ; lvol=  2 ;   6 : (s,t)=(  0.19999999999999996 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  6.852913013006353E-01 ;
pp00aa :     302.20 : myid=  0 ; lvol=  2 ;   7 : (s,t)=(  0.39999999999999991 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  6.463385956424708E-01 ;
pp00aa :     310.36 : myid=  0 ; lvol=  2 ;   8 : (s,t)=(  0.60000000000000009 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  6.133328053460639E-01 ;
pp00aa :     319.10 : myid=  0 ; lvol=  2 ;   9 : (s,t)=(  0.80000000000000004 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  5.850525879471217E-01 ;
pp00aa :     328.10 : myid=  0 ; lvol=  2 ;  10 : (s,t)=(  1.00000000000000000 ,  3.14159265358979312 ) ; utflag=  1 ; transform=  5.605734966629837E-01 ;
ending :            : 
ending :     329.08 : myid=  0 ; completion ; time=    329.08s =     5.48m =   0.09h =  0.00d ; date= 2021/05/27 ; time= 10:58:38 ; ext = Input_0                                                     
ending :            : 
xspech :            :
xspech :     329.08 : myid=  0 : time=    5.48m =   0.09h =  0.00d ;
Note: The following floating-point exceptions are signalling: IEEE_UNDERFLOW_FLAG IEEE_DENORMAL

@jonathanschilling
Copy link
Collaborator

jonathanschilling commented May 27, 2021

I just noted that you are using 12 OpenMP threads when running the latest master branch:

xspech :       0.00 : parallelism : ncpu=  1 ; nthreads= 12 ;

Can you maybe retry with only one thread by exporting OMP_NUM_THREADS=1?

@abaillod
Copy link
Collaborator Author

Thanks, I didn't realize I had set OMP_NUM_THREADS to 12. Changing to only a single thread solved the problem. The final force |f| is slightly different on my machine than on yours, but I guess this is expected since we have different architectures.

newton :       0.88 :         0  0 ; |f|= 3.65065E-03 ; time=      0.86s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :       6.79 :         1  1 ; |f|= 3.65065E-03 ; time=      6.76s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       7.72 :         2  1 ; |f|= 3.22715E-03 ; time=      0.93s ; log|BB|e= -3.25
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       8.63 :         3  1 ; |f|= 3.06683E-03 ; time=      0.91s ; log|BB|e= -3.24
fcn2   :            :              ;                                     ; log|II|o= -4.19
fcn2   :       9.51 :         4  1 ; |f|= 2.91540E-03 ; time=      0.88s ; log|BB|e= -3.22
fcn2   :            :              ;                                     ; log|II|o= -4.24
fcn2   :      10.40 :         5  1 ; |f|= 2.46889E-03 ; time=      0.90s ; log|BB|e= -3.33
fcn2   :            :              ;                                     ; log|II|o= -4.31
fcn2   :      11.31 :         6  1 ; |f|= 1.67566E-03 ; time=      0.91s ; log|BB|e= -3.55
fcn2   :            :              ;                                     ; log|II|o= -4.49
fcn2   :      12.17 :         7  1 ; |f|= 6.65231E-05 ; time=      0.86s ; log|BB|e= -4.86
fcn2   :            :              ;                                     ; log|II|o= -6.01
fcn2   :      13.02 :         8  1 ; |f|= 2.01360E-05 ; time=      0.86s ; log|BB|e= -5.42
fcn2   :            :              ;                                     ; log|II|o= -7.10
fcn2   :      13.86 :         9  1 ; |f|= 1.50378E-06 ; time=      0.84s ; log|BB|e= -6.54
fcn2   :            :              ;                                     ; log|II|o= -8.08
fcn2   :      14.70 :        10  1 ; |f|= 2.17590E-08 ; time=      0.84s ; log|BB|e= -8.32
fcn2   :            :              ;                                     ; log|II|o= -9.84
fcn2   :      15.56 :        11  1 ; |f|= 1.15298E-09 ; time=      0.86s ; log|BB|e= -9.54
fcn2   :            :              ;                                     ; log|II|o=-11.04
fcn2   :      16.44 :        12  1 ; |f|= 2.72104E-10 ; time=      0.89s ; log|BB|e=-10.28
fcn2   :            :              ;                                     ; log|II|o=-11.91
fcn2   :      17.29 :        13  1 ; |f|= 1.34858E-11 ; time=      0.85s ; log|BB|e=-11.58
fcn2   :            :              ;                                     ; log|II|o=-13.14
fcn2   :      18.14 :        14  1 ; |f|= 2.51500E-12 ; time=      0.85s ; log|BB|e=-12.31
fcn2   :            :              ;                                     ; log|II|o=-13.84
fcn2   :      19.01 :        15  1 ; |f|= 2.32722E-14 ; time=      0.87s ; log|BB|e=-14.19
fcn2   :            :              ;                                     ; log|II|o=-15.96
fcn2   :      19.85 :        16  1 ; |f|= 2.48198E-15 ; time=      0.84s ; log|BB|e=-14.68
fcn2   :            :              ;                                     ; log|II|o=-16.54
newton :            :
newton :      19.85 : finished ; success        ; ic05p*f= 1 ; its=     16 ,   1 ;
xspech :      20.69 : #freeits=  0 ; |f|= 2.60524E-15 ; time=      0.84s ; log|BB|e=-14.67
xspech :            :              ;                                     ; log|II|o=-16.42

Maybe we should add a flag or something in preset.f90 that stops SPEC if the number of threads is not one? Or does anyone use SPEC with multiple threads? This can cause unnecessary headaches...

@jonathanschilling
Copy link
Collaborator

jonathanschilling commented May 27, 2021

Maybe we should add a flag or something in preset.f90 that stops SPEC if the number of threads is not one?

That would defeat the purpose of the OpenMP parallelization ;-)

The real problem is (I think) that SPEC cannot deal so well with being assigned more computing power than it can make use of.
Probably we should improve this. @zhisong Do you have any idea what exactly could go wrong if more OMP_NUM_THREADS
are available than can be made use of in SPEC?

@missing-user
Copy link
Contributor

missing-user commented Nov 14, 2024

Using the current master version 6d2693c

xspech :            : version =  3.23
       :  compiled  : date    = Thu Nov 14 01:00:43 PM CET 2024 ;

on Ubuntu, compiled with BUILD_ENV=gfortran_ubuntu make I cannot reproduce the issue anymore, neither running on 12 OpenMP threads, nor 12 MPI ranks with 1 thread/rank:

OMP_NUM_THREADS=12

       :  compiled  : date    = Thu Nov 14 01:00:43 PM CET 2024 ; 
       :            : srcdir  = /home/user/SPEC ; 
       :            : macros  = src/macros ; 
       :            : fc      = mpif90 ; 
       :            : flags   = -fPIC -fdefault-real-8 -O2 -ffixed-line-length-none -ffree-line-length-none -fexternal-blas -DOPENMP -fopenmp ; 
xspech :            : 
xspech :       0.00 : date=2024/11/14 , 15:13:31 ; machine precision= 1.11E-16 ; vsmall= 1.11E-14 ; small= 1.11E-12 ;
xspech :            : 
xspech :       0.00 : parallelism : ncpu=  1 ; nthreads= 12 ;
rdcmdl :            : 
rdcmdl :            : 
rdcmdl :       0.00 : ext = Input_0                                                                                             
xspech :            : 

[...]

preset :       0.00 : Nt=    64 ; Nz=    48 ; Ntz=     3072 ;
newton :       0.58 :         0  0 ; |f|= 3.65065E-03 ; time=      0.40s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :       6.46 :         1  1 ; |f|= 3.65065E-03 ; time=      6.28s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       6.97 :         2  1 ; |f|= 3.22715E-03 ; time=      0.50s ; log|BB|e= -3.25
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       7.46 :         3  1 ; |f|= 3.06683E-03 ; time=      0.50s ; log|BB|e= -3.24
fcn2   :            :              ;                                     ; log|II|o= -4.19
fcn2   :       7.91 :         4  1 ; |f|= 2.91540E-03 ; time=      0.44s ; log|BB|e= -3.22
fcn2   :            :              ;                                     ; log|II|o= -4.24
fcn2   :       8.35 :         5  1 ; |f|= 2.46889E-03 ; time=      0.45s ; log|BB|e= -3.33
fcn2   :            :              ;                                     ; log|II|o= -4.31
fcn2   :       8.81 :         6  1 ; |f|= 1.67566E-03 ; time=      0.45s ; log|BB|e= -3.55
fcn2   :            :              ;                                     ; log|II|o= -4.49
fcn2   :       9.29 :         7  1 ; |f|= 6.65231E-05 ; time=      0.48s ; log|BB|e= -4.86
fcn2   :            :              ;                                     ; log|II|o= -6.01
fcn2   :       9.75 :         8  1 ; |f|= 2.01360E-05 ; time=      0.46s ; log|BB|e= -5.42
fcn2   :            :              ;                                     ; log|II|o= -7.10
fcn2   :      10.19 :         9  1 ; |f|= 1.50378E-06 ; time=      0.44s ; log|BB|e= -6.54
fcn2   :            :              ;                                     ; log|II|o= -8.08
fcn2   :      10.66 :        10  1 ; |f|= 2.17590E-08 ; time=      0.47s ; log|BB|e= -8.32
fcn2   :            :              ;                                     ; log|II|o= -9.84
fcn2   :      11.09 :        11  1 ; |f|= 1.15298E-09 ; time=      0.43s ; log|BB|e= -9.54
fcn2   :            :              ;                                     ; log|II|o=-11.04
fcn2   :      11.56 :        12  1 ; |f|= 2.72121E-10 ; time=      0.47s ; log|BB|e=-10.28
fcn2   :            :              ;                                     ; log|II|o=-11.91
fcn2   :      11.99 :        13  1 ; |f|= 1.34703E-11 ; time=      0.44s ; log|BB|e=-11.58
fcn2   :            :              ;                                     ; log|II|o=-13.14
fcn2   :      12.48 :        14  1 ; |f|= 2.52016E-12 ; time=      0.49s ; log|BB|e=-12.31
fcn2   :            :              ;                                     ; log|II|o=-13.84
fcn2   :      12.93 :        15  1 ; |f|= 1.68055E-14 ; time=      0.46s ; log|BB|e=-14.31
fcn2   :            :              ;                                     ; log|II|o=-16.03
fcn2   :      13.41 :        16  1 ; |f|= 3.02381E-15 ; time=      0.48s ; log|BB|e=-14.65
fcn2   :            :              ;                                     ; log|II|o=-16.74
newton :            :
newton :      13.41 : finished ; success        ; ic05p*f= 1 ; its=     16 ,   1 ;
xspech :      13.88 : #freeits=  0 ; |f|= 3.02381E-15 ; time=      0.46s ; log|BB|e=-14.65
xspech :            :              ;                                     ; log|II|o=-16.74

12 MPI ranks

xspech :            : version =  3.23
       :  compiled  : date    = Thu Nov 14 01:00:43 PM CET 2024 ; 
       :            : srcdir  = /home/user/SPEC ; 
       :            : macros  = src/macros ; 
       :            : fc      = mpif90 ; 
       :            : flags   = -fPIC -fdefault-real-8 -O2 -ffixed-line-length-none -ffree-line-length-none -fexternal-blas -DOPENMP -fopenmp ; 
xspech :            : 
xspech :       0.00 : date=2024/11/14 , 15:15:24 ; machine precision= 1.11E-16 ; vsmall= 1.11E-14 ; small= 1.11E-12 ;
xspech :            : 
xspech :       0.00 : parallelism : ncpu= 12 ; nthreads=  1 ;
rdcmdl :            : 
rdcmdl :            : 
rdcmdl :       0.00 : ext = Input_0                                                                                             
xspech :            : 
[...]

preset :       0.00 : Nt=    64 ; Nz=    48 ; Ntz=     3072 ;
newton :       0.72 :         0  0 ; |f|= 3.65065E-03 ; time=      0.46s ; log|BB|e= -3.19
newton :            :              ;                                     ; log|II|o= -4.13
fcn2   :       6.32 :         1  1 ; |f|= 3.65065E-03 ; time=      6.06s ; log|BB|e= -3.19
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       6.78 :         2  1 ; |f|= 3.22715E-03 ; time=      0.46s ; log|BB|e= -3.25
fcn2   :            :              ;                                     ; log|II|o= -4.13
fcn2   :       7.25 :         3  1 ; |f|= 3.06683E-03 ; time=      0.47s ; log|BB|e= -3.24
fcn2   :            :              ;                                     ; log|II|o= -4.19
fcn2   :       7.83 :         4  1 ; |f|= 2.91540E-03 ; time=      0.58s ; log|BB|e= -3.22
fcn2   :            :              ;                                     ; log|II|o= -4.24
fcn2   :       8.34 :         5  1 ; |f|= 2.46889E-03 ; time=      0.51s ; log|BB|e= -3.33
fcn2   :            :              ;                                     ; log|II|o= -4.31
fcn2   :       8.84 :         6  1 ; |f|= 1.67566E-03 ; time=      0.50s ; log|BB|e= -3.55
fcn2   :            :              ;                                     ; log|II|o= -4.49
fcn2   :       9.40 :         7  1 ; |f|= 6.65231E-05 ; time=      0.56s ; log|BB|e= -4.86
fcn2   :            :              ;                                     ; log|II|o= -6.01
fcn2   :       9.90 :         8  1 ; |f|= 2.01360E-05 ; time=      0.50s ; log|BB|e= -5.42
fcn2   :            :              ;                                     ; log|II|o= -7.10
fcn2   :      10.39 :         9  1 ; |f|= 1.50378E-06 ; time=      0.49s ; log|BB|e= -6.54
fcn2   :            :              ;                                     ; log|II|o= -8.08
fcn2   :      10.99 :        10  1 ; |f|= 2.17590E-08 ; time=      0.59s ; log|BB|e= -8.32
fcn2   :            :              ;                                     ; log|II|o= -9.84
fcn2   :      11.50 :        11  1 ; |f|= 1.15298E-09 ; time=      0.51s ; log|BB|e= -9.54
fcn2   :            :              ;                                     ; log|II|o=-11.04
fcn2   :      12.01 :        12  1 ; |f|= 2.72123E-10 ; time=      0.51s ; log|BB|e=-10.28
fcn2   :            :              ;                                     ; log|II|o=-11.91
fcn2   :      12.60 :        13  1 ; |f|= 1.34625E-11 ; time=      0.60s ; log|BB|e=-11.58
fcn2   :            :              ;                                     ; log|II|o=-13.14
fcn2   :      13.20 :        14  1 ; |f|= 2.52690E-12 ; time=      0.60s ; log|BB|e=-12.31
fcn2   :            :              ;                                     ; log|II|o=-13.84
fcn2   :      13.76 :        15  1 ; |f|= 2.50979E-14 ; time=      0.56s ; log|BB|e=-14.14
fcn2   :            :              ;                                     ; log|II|o=-16.03
fcn2   :      14.32 :        16  1 ; |f|= 3.94848E-15 ; time=      0.56s ; log|BB|e=-14.59
fcn2   :            :              ;                                     ; log|II|o=-16.59
newton :            :
newton :      14.33 : finished ; success        ; ic05p*f= 1 ; its=     16 ,   1 ;
xspech :      14.88 : #freeits=  0 ; |f|= 3.94848E-15 ; time=      0.54s ; log|BB|e=-14.59
xspech :            :              ;                                     ; log|II|o=-16.59
xspech :            :

Seems like the issue has been resolved then?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants